~英語圏となるフィリピンの自社オフショア拠点による、日英の教師データ作成も対応~
ITにより企業のDX化推進をサポートする、株式会社サイバーテック(代表取締役社長:橋元 賢次 本社:東京都渋谷区、以下サイバーテック)は、テキストマイニング用AIシステムの教師データ作成サービスを開始いたしました(開始日:2023年3月6日)。
DX(デジタルトランスフォーメーション)の推進が求められている昨今、AIを活用することによるビジネスモデル改革や業務カイゼンは進んでおり、社会へのインパクトは日増しに大きくなっております。そのような中、SNSで投稿された内容や口コミからの掘り起こし、アンケートに書かれた文章の分析、文章内のおおよその意味を判別するネガポジ判定や、論文などから必要とするテキスト情報を抽出するといった、テキストマイニングにもAIの活用が進んでいます。さらに、自然言語処理技術も進んだ結果、Google翻訳に代表される機械翻訳の性能向上や、話題性の高いAIチャットサービス「ChatGPT」の登場など、コミュニケーション分野におけるAI技術の向上は目覚ましいものがあります。これらのテキスト情報を扱うAIシステムでは、コーパス情報をはじめとする大量の教師データの準備が求められます。
サイバーテックでは、数年前にAIによるゆらぎ検出~ライティング支援エンジンを自社開発したことを皮切りに、フィリピンに有する自社オフショア拠点「セブITアウトソーシングセンター」にて、AIシステム向けのアノテーションサービス「セブ ハイスペック アノテーション」を提供してまいりました。今回リリースした「テキストマイニング用AIシステムの教師データ作成サービス」は、AIによるゆらぎ検出~ライティング支援エンジンでも必要とされた教師データ作成ノウハウをベースに、テキスト情報へのアノテーションサービスをリーズナブルにご提供いたします。
特に、自社オフショア拠点「セブITアウトソーシングセンター」があるフィリピンは、公用語が英語であり、新興国の中でも非常に高い英語力を有する地域となります。したがって、テキストマイニング用AIシステムに用いられる教師データは日本語に限らず、英語による論文や調査記事、英字新聞などといった、英語コンテンツを対象とした教師データ作成も可能です。
サイバーテックの「テキストマイニング用AIシステムの教師データ作成」サービスの特徴は次の3点となります。
英文に対するアノテーションを実施するうえで、しっかりとした英文の読解力は最低限必要となりますが、弊社が自社オフショア拠点を有するフィリピンは高い英語力を有する人材が多数存在します。その中でもセブ島エリアはフィリピンの首都マニラと比較した場合、おおよそ3分の2の物価であるにもかかわらず、数多くの英語スクールが存在するとともに、オンライン英会話の講師が多く輩出される高い英語力を有する人材が豊富なエリアです。したがって英語テキスト情報に対しても高品質かつリーズナブルなアノテーション作業を行うことが可能です。
アノテーション作業は、オフィスに出社している直接雇用の正社員が行いますので、社内でFace to Faceによるコミュニケーションを取りながら、高品質のアノテーション作業を実施することが可能です。経験豊富なアノテーションマネージャが進捗管理やチェック体制の構築、指示書の作成や見直しなどを行い、アノテーション経験が豊富なメンバーで構成されたチーム体制での作業となるため、属人的な「バラツキ・誤差」を極力なくし、高品質なテキストマイニング向け教師データ作成を実現します。ちなみに、セブITアウトソーシングセンターには日本人も複数名在籍しておりますので、日本語のテキストを対象としたアノテーションも対応可能です。
一般的なアノテーション業務委託の形式でもリーズナブルにテキストマイニング用AIシステムの教師データ作成が可能ですが、セブITアウトソーシングセンターの経験豊富なアノテータースタッフやアノテーションチームごと、皆様の企業におけるアノテーション部門としてBynameによるラボ型の要員固定を行っていただくことが可能です。これにより、大規模AIシステムのモデル構築と並走した形で学習データ作成体制を構築することや、長期プロジェクトでのさらなる品質向上とコストダウンを実現することが可能となります。
サイバーテックが提供する、AIシステム向けのアノテーション作業代行「セブ ハイスペック アノテーション」サービスでは、主に画像データを中心に、次のようなAIシステム向けの学習データ(教師データ)作成を実施してきました。
今後は、ドキュメントソリューション事業と親和性が高い「テキストマイニング用AIシステムの教師データ作成」サービスをラインナップに加えることにより、画像データセットに対するアノテーションに加え、テキストデータに対するAIアノテーションにもサービス対象範囲を広げることになりました。これにより、サイバーテックは、AI分野をはじめ、さらに付加価値の高い自社製品・サービスを提供いたします。
「テキストマイニング用AIシステムの教師データ作成」サービスをご案内するWebサイトは以下となります。
URL:https://www.cybertech.co.jp/ito/service/annotation-work/text-mining/
「AIアノテーション・BPO」事業をご案内するWebサイトは以下となります。
URL:https://www.cybertech.co.jp/ito/
サイバーテックは、企業の情報化投資において、高い費用対効果とDX対応を実現するソフトウェア製品とITサービスを企業の皆さまに提供しております。今回の取り組みにより、得意とするドキュメンテーション分野と、英語圏オフショアの強みを活かしたAIアノテーションサービスを拡充させる事で、皆様のDX推進のサポートをいたします。
1)ドキュメントソリューション~マニュアルからDX推進と効率化を実現
マニュアルの共同制作・多言語化・組版と電子化を実現するプラットフォーム「PMX」を中心に、企業のDX化を推進します。
URL:https://www.cybertech.co.jp/xml/
2)Webソリューション~安心のWeb運用と高セキュリティの基盤構築
Webコンテンツ運用サービス「サブスクWeb運用」や、基盤運用・セキュリティ対策を中心に、WebリニューアルやCMS導入・マイグレーションまで、幅広いサービスをご提供いたします。
URL:https://www.cybertech.co.jp/websol/
3)AIアノテーション・BPO~プロフェッショナルサービスが1人月10万円~
AI向け学習データ作成サービス「セブ ハイスペック アノテーション」を中心に、データ加工やオフショア開発、英語サポートを、高品質かつリーズナブルにご提供します。
URL:https://www.cybertech.co.jp/ito/
御相談、ご質問はこちら |
サービスご案内資料や、特別資料「神は細部に宿る~アノテーションを駆使したAIシステムの精度向上」がダウンロードできます。 |
最新事例の公開情報や、イベント・セミナー情報をお届けします。 |