スキャンデータの補正・属性情報の作成・タグ付け

ITアウトソーシング「スキャンデータの補正・属性情報の作成・タグ付け」サービス詳細ページはこちら

DX推進に伴い、大量かつ様々な種類のコンテンツをデータベース化した上で、検索性向上やアクセスを容易にする必要性が増加しています。特に、OCRでスキャンしたデータの確認や補正・マルチメディアコンテンツの検索性を高めるタグ付けなどは、地味ですが対象データは多くなる傾向にあります。
サイバーテックがフィリピンに有する自社オフショア拠点「セブITアウトソーシングセンター」で行う「スキャンデータの補正・属性情報の作成・タグ付け」作業では、対象となるデータ数が多い場合であっても、データの補正や、属性情報の作成・タグ情報の付与といったデジタルBPOサービスを高品質かつリーズナブルにご提供いたします。

コンテンツから属性情報の抽出~作成・タグ付けが求められる背景

IT技術の発達や、ハンドリング可能なデータ量の飛躍的な増大、コンテンツ自体の多様化や肥大化に伴い、お客様へのサービス提供という点においては、いかにして検索性を向上させるか、という課題が重要視されています。また、社内コストの面においては、業務上必要となる情報へのアクセス効率を向上させることが、『従業員一人当たりの情報検索にかかる時間×従業員数』、といった形で発生する無駄なコストを削減することが可能となるため、経営面においても重要課題といえるのではないでしょうか。

いずれの場合においても、画像・音声・動画などをはじめとするリッチコンテンツはもちろん、紙情報をスキャンしたレガシー情報の検索性を向上させる方法として、それらの情報に属性情報やタグ情報といった、メタ情報(メタデータ)と呼ばれる、「データのデータ」をXMLなどのタグ形式で付与した上で、コンテンツ データベースを構築することが効果的です。しかしながら、コンテンツからタグ情報を抽出して付与を行う作業はツールで一括出力することが困難であることが多く、人手による地道な作業となるため、想像以上に時間とコストがかかります。

具体的な例をあげると、過去の文書を単にスキャンしデータ化する作業よりも、それらのデータの意味を理解し、属性情報やタグ情報を付与するほうが、実は手間も時間もかかります。一見単純作業のように見えますが、処理ルールを定義し、自動化を行うツールであるRPA(ロボティック・プロセス・オートメーション:Robotic Process Automation)の活用は、例外処理が多く発生するため、現実的ではありません。社内の手が空いている従業員で片手間に行う事もできますが、分量が膨大である場合はそれだけ時間を要するので現実的ではないばかりではなく、単純作業となるITオペレーション作業は、従業員にとって大きなモチベーションダウンの要因となります。

「コンテンツから属性情報の抽出~作成・タグ付け」サービス概要

画像・音声・動画などが含まれるリッチコンテンツに限らず、DTP・Office文書・PDFなど、様々なコンテンツ情報の内容を理解し、属性情報を抽出することや、タグ付けをする作業は、特にコンテンツ・データベースを構築する際には必須となります。オペレーション作業が中心となるため、ITの高度な専門知識は不要ですが、対象データが大量になることが多いため、大量データの処理とリーズナブルなコスト、という両面から考えると、海外オフショアへのアウトソーシングは効果的な解決方法となります。

サイバーテックが提供する「コンテンツから属性情報の抽出~作成・タグ付け」サービスは、フィリピン セブ島に有する自社オフショア拠点である「セブITアウトソーシングセンター」にて実施いたします。皆さまが保有する様々なコンテンツやドキュメント情報に対して、単純な属性データの作成はもとより、コンテンツ データベースに初期データを投入する際に必要となる構造化された属性情報を「日本品質・リーズナブル」に実施することにより、コンテンツ データベース化における総コストを最小限に抑えることが可能です。

属性情報の抽出や作成、タグ情報の付与作業は、現地在住の日本人がディレクションを行います。RPAなどにより自動化できる部分もありますが、人手による修正やチェックといった工程は必ず入るため、日本人がフィリピン人に指導しながら現地で作業を行います。そのような体制を持つ日系の海外オフショア拠点だからこそ、低コストと日本品質を両立させたサービスを提供することが可能です。さらに、日本語が中心となる教育サービス向けの教材に関しても、属性情報やタグ付けを行っています。教材には縦書きも存在しますが、経験豊富な日本人ディレクションの下、フィリピン人オペレータに適切に作業指示を行うノウハウを有しているため、日本語コンテンツへの対応も問題ありません。セブITアウトソーシングセンターでは豊富な人的リソースを有しておりますので、繁忙期へのご対応や突発的な業務などにも柔軟に対応させていただくことが可能です。

「コンテンツから属性情報の抽出~作成・タグ付け」サービスの特徴

安心の日系企業なのに低価格、上流からのご提案も可能!

東京を本社とする日本企業である当社運営する、日系の海外オフショア拠点だからこそ、日本品質ながらリーズナブルなITアウトソーシング(コンテンツから属性情報の抽出~作成・タグ付け)サービスを実現していますので、初めての海外オフショア委託である場合でもご安心ください。コンテンツの構造化自体がまだである場合は、XML分野のリーディングカンパニーとしてメタデータに長年携わってきた当社のノウハウを活かし、紙面分析や構造化のご提案も可能です。したがいまして、ボリュームが多い・ITスキルが求められる、といった属性情報・タグ情報の付与だけではなく、「どのようなデータを付与したらよいか分からない」といった場合につきましても、お気軽にお問合せください!

人海戦術による、コピペによるデータ収集やデータ起こしなども対応!

属性情報やタグ情報の生成を行う際に、元データの加工・修正などが必要となる場合もありますが、人海戦術が求められる「コピペによるデータ収集」や「データ起こし」といった作業も実施いたします。データソースは、通常の画像・動画・音声形式のファイルだけではなく、OCRによるスキャンデータをはじめ、Webサイトや、PDF・DTPデータ、MS Word・Excel・PowerPointなど、どのようなものでも大丈夫です。要件により、スクリプトによる自動抽出~チェックだけで可能なものや、スクリプトによる半自動抽出~オペレータによる微修正、あるいはそれらが困難な場合は全て手作業による人海戦術により、大量のデータに関しても、様々な方法でリーズナブルに属性情報やタグ情報の生成をいたします。

コンテンツをシェアNo.1のソフトウェアでデータベース化する仕組み自体も提供!

当社はITアウトソーシング・デジタルBPO事業とは別に、様々なコンテンツ管理を行うことが可能である、シェアNo.1のデータベース システム(XMLデータベースシステム「NeoCore」)を提供しており、XMLを得意とするサイバーテックだからこそ、メタデータを様々なコンテンツに付与し、データベース化するといった案件も多数実績がございます。したがって、属性情報の抽出~作成・タグ付けを単なる作業として実施するだけにとどまらず、コンテンツ データベース構築におけるベストプラクティスを同時にご提供することが可能です。単なるアウトソーサーというポジションから、情報基盤のシステムインテグレーションも可能であるため、幅の広いご提案を行わせて頂くことが可能です。

「コンテンツから属性情報の抽出~作成・タグ付け」サービス内容

「コンテンツから属性情報の抽出~作成・タグ付け」を行うサービスの流れは以下の通りとなります。

1. 現状のヒアリングと作業手順書の確認・作成

現状の課題やご要望のヒアリングを行った上、タグ付け対象の実コンテンツを拝見し、要件を確認いたします。作業手順書が存在する場合は、そちらに沿って属性情報の抽出・作成~タグ付けを実施した際の見積もりを実施します。存在しない場合は、上流から携わることで、構造化設計を行い、作業手順書を作成いたします。秘密保持契約の締結が必要となる場合は、いつでもお申しつけください。

下矢印

2. トライアルプロジェクトの実施

ご提案プランの内容で着手指示頂く前提、もしくは少額のご発注により、少ロットの実コンテンツデータを用いた、属性情報の抽出・作成~タグ付け作業をトライアルプロジェクトとして実施いたします。トライアルプロジェクトでの成果物をご確認後、正式にご発注頂けますので、オフショア委託が初めてのお客さまでも安心してご依頼いただけます。

下矢印

3. トライアルプロジェクトの評価・検証

小ロットの実コンテンツデータを用いたトライアルプロジェクトを行った結果について、評価・検証を行い、見積もり内容と現状に差異があったかどうか検討いたします。その上で、当初ご提案したプラン通りで良いか、あるいは別のプランを再検討すべきか、このフェーズで検証させていただき、別プランが良いという判断になった場合は、価格や期日などに関して再度ご提案の上、2.に戻り再度トライアルプロジェクトを実施することも可能です。

下矢印

4. 本番プロジェクトの開始

トライアルプロジェクトの評価・検証を経て、問題無いとご判断頂いた後、全てのコンテンツデータを対象とした本番プロジェクトを開始いたします。本番プロジェクトの途中であっても、対象コンテンツへの追加・変更などにより実施フローの変更が必要となった場合は、軽微なものであればプロジェクト内で吸収した形で進めることが可能です。抽出データや属性情報の大幅な修正が必要となった場合は、2.もしくは3.のフェーズに戻り、方式の再検討から進めさせていただきます。

「コンテンツから属性情報の抽出~作成・タグ付け」サービスの事例・価格

PDFの教材から属性情報を抽出、Excelに入力

概要 100冊分の問題集から問題メタデータを抽出し、csvファイル化、属性情報の整理や日本語入力が必要なものは日本人チーム、問題番号やページ数といった簡単な内容はフィリピン人チームで実施。入力ツールを自社で開発することでcsv化を圧倒的に短縮した。日本人チームによるcsv最終チェックも行った。
PDFの教材データの内容を理解した上で、データを整理し、お客様に代わってExcelに教材の属性データを実施。
ボリューム 100冊分・数千問
使用ツール・技術 Microsoft Excel
作業場所 セブITアウトソーシングセンター(フィリピンの自社オフショア拠点)
価格・費用 お問合せください

上記は一般的な「コンテンツから属性情報の抽出~作成・タグ付け」サービスの事例となります。そのほか多数の事例がございます、詳細はお問合せください。

「コンテンツから属性情報の抽出~作成・タグ付け」サービス Q&A

「コンテンツから属性情報の抽出~作成・タグ付け」サービスに関する次のような課題をお持ちではありませんか?

海外オフショアは、やはり品質・コミュニケーション面で不安です。

ご契約および受発注は、全て東京本社と実施いただき、かつ本社直轄のオフショア拠点で実施いたしますので、いわゆる「安かろう・悪かろう」といった問題や、突然連絡が取れなくなる、といったトラブルが多発する、現地資本ベースの海外オフショア企業とは異なり、責任を持って取り組ませて頂きます!

フィリピン人は、英語は得意だが日本語が苦手と聞いていますが、大丈夫?

セブITアウトソーシングセンターのフィリピン人スタッフは日本語が読めませんが、全ての案件に英語が堪能な現地日本人スタッフが付きますので、日本人とフィリピン人が協調しながら業務を進めております。縦書きコンテンツの対応実績も豊富ですので、ご安心ください。10年以上の海外オフショア拠点の運営ノウハウがございますので、プロジェクト内にて必要となる手順書(指示書)の作成にも蓄積された独自のノウハウを有しており、海外委託における一番のリスクであるコミュニケーションの齟齬を防ぐことができます。

日本人が全てディレクションに入ると、結局割高になるのでは?

オフショア委託で一番コスト超過に陥る理由は「クオリティや納品内容の齟齬による追加費用」となります。経験豊かな日本人ディレクターがしっかり管理することにより、納期はもちろんのこと、手戻りを防ぐことにより、トータルで見ると必ず低コストにつながります。もちろん国内企業への委託と比べてもリーズナブルです。

外国とのやり取りはタイムラグが心配なのですが

セブITアウトソーシングセンターがあるフィリピン・セブ島は、日本との時差がたった1時間しかありません。さらに、始業時間なども日本時間に合わせておりますので、メールやスカイプのやり取りでもリアルタイムに行っていただくことが可能であるため、国境や時差を感じさせることはございません!

急ぎの納期でも対応してもらえる?

自社オフショア拠点「セブITアウトソーシングセンター」は、フィリピン セブ島エリアの独立系日系ITサービス企業において最大規模であり、豊富な人的リソースを抱えております。したがって、急な納品対応や業務ピークにも柔軟な要員調整により対応させていただくことが可能です!

御相談、ご質問はこちら

サービスご案内資料や、特別資料「神は細部に宿る~アノテーションを駆使したAIシステムの精度向上」がダウンロードできます。

最新事例の公開情報や、イベント・セミナー情報をお届けします。

pagetop ボタン
サイバーテックお知らせ画像
©2018 CyberTech corporation ltd. All Rights Reserved.