top of page
Problem
こんなお悩みありませんか?
すぐに使える学習データがほしい…
AI開発者
Case 01
学習量
もっと学習ボリュームを増やしたい・・・
Case 02
利用許諾
社内の限られたデータしか使えない・・・
Case 03
種類
ドメイン違いの会話データがほしい・・・
About
音声アノテーションが専門
audioコーパス®は、書き起こし技術をベースに、音声認識AIの学習用データを作成するアノテーション専門会社です。
10年以上書き起こし業界に携わった経験を活かし、品質向上に全力でサポートします。すべてが自社製作のオリジナルデータ。PoCの検証にも最適な教師データをお届けします。
Contents
AI学習用データセット
作成に手間と時間のかかる
アノテーション付与した教師データ(.txt)を、
発話ドメインごとの収録音源(.wav)とセットで、
データ販売いたします。
教師データ
00:00:01,00:00:04,お電話ありがとうございます。
00:00:09,00:00:12,お世話になります。私、山田と申します:。
00:00:15,00:00:20,(F はい)本日はどんなご用件でしょうか。
00:00:22,00:00:26,(D は)初めてご連絡するんですけども、
00:00:26,00:00:27,(F はい)ありがとうございます。
00:00:32,00:00:36,(F あ)御社のホームページ拝見しまして:、
00:00:40,00:00:47,(F えー)お電話差し上げました。
00:00:49,00:00:53,ご覧いただき、誠にありがとうございます。
00:00:55,00:01:00,当サービスをご説明させていただきます。
※話者識別 , 区間区切り , アノテーション書き起こし
音声認識を一歩先へ
Quality
トコトンこだわった品質
書き起こしやタグ入力は、誰でもできる軽作業と思われがちですが、要件定義やゆらぎ防止など品質追求が欠かせません。
アノテーションは、書き起こしの基本をおさえ、教育指導、作業マニュアル、ベテラン作業者、ディレクション管理が必要不可欠です。