~PythonやTensorFlow、Kerasによる、学習データの水増しサービスを実施~
お客様のドキュメント活用をサポートする、株式会社サイバーテック(代表取締役社長:橋元 賢次 本社:東京都渋谷区、以下サイバーテック)は、AI(人工知能)分野におけるディープラーニングで大量に必要となる学習データ(教師データ)の水増し処理である、学習データ拡張(Data Augmentation)サービスを開始いたします(開始日:2019年6月5日)。
ハードウェアのスペック向上とともに、AI(人工知能)技術を応用したソリューションへのニーズは日増しに高まっています。その中でも、従来のルールベースによるAIや、応用技術であるRPA(ロボティック・プロセス・オートメーション)から、ディープラーニング(深層学習)によるAIへとニーズは移りつつあります。このディープラーニングに必要不可欠となるものは、チューニングなどの構築ノウハウと同時に、大量の学習データとなります。
サイバーテックでは、数年前からディープラーニングに取り組み、現在は多言語マニュアルの標準化・改訂コスト削減・Web化を実現するCMS「Publish MakerX」のオプションとして、AI校正機能を提供しております。その過程において、過学習・過剰適合(学習データに対して判別器が最適化されてしまい、汎用性が無くなる事)を避け、安定した判別器を生成するために、少ない学習データ(教師データ)を水増しする作業(データ拡張)にも取り組んできました。
このたび提供する「AI向け学習データ作成(画像データの拡張)」サービスは、ディープラーニング(深層学習)に用いる学習データ(教師データ)の水増し処理を行うサービスとなります。画像データを対象に、PythonやTensorFlow、Kerasといった汎用的な技術を用い、元の画像データに様々なエフェクトをかけることで、学習データを適正な形で何倍にも増やします。作業場所は、サイバーテックがフィリピン セブ島に有する自社オフショア拠点「セブITアウトソーシングセンター」にて実施いたします。日本品質で様々なBPO・ITアウトソーシングサービスを提供する同拠点では、数年前よりAI校正オプションに用いる学習データ作成を行ってきたノウハウを流用し、このたび画像アノテーションサービスを開始することにいたしました。
また、学習データの拡張を行わなくとも良い、十分な分量の学習データが既に存在する場合は、単に学習データを分類する「AI向け学習データ作成(画像データのアノテーション - クラシフィケーション)」サービスがご利用頂けます(https://www.cybertech.co.jp/ito/service/annotation-work/classification/)。
画像データの拡張は、セブITアウトソーシングセンター内のエンジニアがTensorFlowやKeras、Pythonといった、汎用性の高いテクノロジを用いて行います。クラウドソーシングによる在宅や再委託ではないので、データ流出の心配もありません。もちろん、プロジェクトの内容自体の守秘性も守られます!
セブITアウトソーシングセンターは、海外オフショア委託先の中でも、ベトナム(ホーチミン・ハノイ)よりも物価が安い「フィリピン中部(セブエリア)」に位置します。エンジニア不足の状況にもかかわらず、リーズナブルに画像データの拡張サービスを提供いたします!
セブITアウトソーシングセンターは2006年に設立し、様々なITアウトソーシング・BPOサービスをはじめ、オフショア開発などのエンジニアリング業務を日本のお客様向けに提供してまいりました。組織成熟度の高い同拠点で、高品質なデータ拡張作業を行い、学習データを納品いたします!
以下の変換手法を基本パターンとした、画像データ拡張(水増し)を行います。それ以外の拡張パターンに関しても、指定頂いた仕様とパラメータにより実施可能です。
指定角度の範囲でランダムに回転、もしくは設定値に応じた角度で画像を回転します(以下は36度ずつ回転)。
指定ズームの範囲でランダムにズーム、もしくは設定値に応じたピッチのズーム倍率により、画像をズーム処理します(以下はズーム倍率を10~90%に設定)。
指定したシフト幅の範囲で、ランダムに水平シフトを行います(以下は水平シフト幅を10~90%に設定)。
指定したシフト幅の範囲で、ランダムに垂直シフトを行います(以下は垂直シフト幅を10~90%に設定)。
画像をランダムに水平反転します。
画像をランダムに垂直反転します。
指定したシアー変換値の範囲で、ランダムにシアー変換をかけます(以下はシアー変換値を10~90%の範囲に設定)。
指定したチャンネル(RGB値)の範囲で、ランダムに変換をかけます(以下はRGB値を[0,0,0] - [2,2,2]の範囲で設定)。
◎AI向け学習データ作成(画像データの拡張)サービス
https://www.cybertech.co.jp/ito/service/annotation-work/data-augmentation/
※詳細は担当営業までお問合せください
今後は国内シェアNo.1のXMLデータベース「NeoCore」や「Publish MakerX」、さらには今回リリースさせて頂いた、AI向け画像データの拡張(水増し)サービスにより、ディープラーニングを活用した皆さまのプロジェクトにおいて、リーズナブルかつ高い精度によるAIを実現するためのご支援をいたします。
御相談、ご質問はこちら |
サービスご案内資料や、特別資料「神は細部に宿る~アノテーションを駆使したAIシステムの精度向上」がダウンロードできます。 |
最新事例の公開情報や、イベント・セミナー情報をお届けします。 |