模擬試験問題のデータベース化(紙のデータ化及び問題検索アプリケーション開発)

ITアウトソーシング事例

模擬試験問題のデータベース化
(紙のデータ化及び問題検索アプリケーション開発)

株式会社首都圏中学模試センター

紙とPDFが混在していたコンテンツデータを一元化。問題情報データベースにより作問業務の大幅な効率アップを実現

私立中学や公立中高一貫中学校への合格を目指す小学生向けに、模擬試験サービスを提供する株式会社首都圏中学模試センター(以下、同社)は、申込み受付・採点・成績表返却をはじめ、自社で制作した教材の販売や出版なども行う教育サービス企業である。同社は、刻々と変化する中学受験環境や先進的な教育スタイルに対応するため、自社内での作問業務をはじめとした改善に取り組んでおり、今回はその一つである「模擬試験問題のデータベース化」について、導入の背景と効果を伺った。

株式会社首都圏中学模試センター様メイン画像

背景

模擬試験問題のデータベース化を決定した背景

教育現場において、教育ICT導入の流れは加速している一方、少子化による教育コンテンツ提供側の効率向上も求められている。そのような中、作問業務自体の効率化について同社内で検討が行われ、模擬試験問題のデータベース化が必要ではないか、という結論に達した。その背景と課題を、取締役の山下様に伺った。

「弊社は、毎年10回以上模擬試験を実施しています。模擬試験の問題は、毎回オリジナルのものを自社で作成していますが、その作問業務の負荷が高く、もっと効率化出来ないかと考えていました。」

模擬試験の作問担当者は、作問する前に、過去に出題された問題を参考にして重複や間違いがないかを確認する。さらに、新問題を作成するために、過去問題からヒントやアイデアを見つけることが必要とされており、これらの業務をより効率良く進める事ができる方法を模索していた。

課題

過去の問題情報が紙やPDFで散逸

株式会社首都圏中学模試センター/山下一氏の写真

しかし、同社では、「今まで模擬試験の問題は、紙とPDFファイルがバラバラの状態で社内に散在している状態で、重複の確認はおろか、過去問題を応用した新問題を作ろうとしても、欲しい情報を探し出すだけでも苦労していました」(山下氏)。

1997年から模擬試験サービスを開始している同社が保有している過去の模擬試験の問題数は膨大で、冊子数は800~1,000冊、ページ数にして約10,000ページ以上にものぼる。同社にとって、これらの問題は貴重な情報資産であり、ナレッジでもある。過去10年分の問題はPDFデータとしてファイルサーバに保管されているが、それ以前の問題は、紙の状態で段ボールに保管されている状態であるため、作問担当者だけでなく管理者もこれらの情報がデータベース化されていない状態に頭を抱えていた。

「データベース化に踏みこめない理由は、手間とコストの問題でした。紙のデータを誰がどのように電子化するのかを設計し、スキャンする。これを自社でやる余裕はありませんでした。さらに、データベースのシステム構築ができるエンジニアが社内にいないため、外部に委託しなければいけなく、そのコストが膨大にかかるのではないかと考えていました」(山下氏)。


過去問データベースを目指して

過去問データベースの検討開始~将来的にはXML化を目指して

山下氏は以前に、当時採点システムを依頼していたある企業から、サイバーテックの事を聞いた。サイバーテックが持つXML技術は、問題が持つ階層構造や、変化が激しい問題の属性情報を管理するのに最適なデータフォーマットではないかと考え、セミナーを聴講する等の情報収集を行った。そして、問題データベースの最終ゴールイメージとして、「膨大な過去問題をXMLデータベースで管理し、複雑な属性も横串で検索することで必要な情報を素早く取り出せるような仕組み」を構想した。そのためにまずは、紙の情報をデジタル化して情報を一元管理することから始めることを決断、アプリケーションの開発と教材コンテンツの管理や制作の両面で多くの実績とノウハウを持つサイバーテックに相談をした。

サイバーテックの提案内容

1. 紙のデジタル化~大量データの加工はオフショア・アウトソーシングを活用

同社は、最初に「紙のデータをどの様に電子化すればよいか」をサイバーテックに相談した。これに対して、サイバーテックは、フィリピン・セブ島の自社拠点「セブITアウトソーシングセンター」でのオフショア アウトソーシングを提案した。模擬試験のプリントは、教科毎にレイアウトが異なるものの、スキャンした後で問題単位に切り出すことは比較的容易であったからだ。紙をスキャンして、一旦ページ単位でPDF化にしてしまえば、その後工程は切り出しルールに従ってフィリピン人オペレータが問題単位に切り出す作業を繰り返すだけで良いため、オフショア向きのデータ加工作業であるからである。具体的な工程は以下の通り行われた。

  • スキャニング工程:段ボール10箱もの紙の模擬試験問題のスキャニングは専門業者に依頼し、ページ単位でPDF形式にデータ化。Webアプリケーションで検索することを考慮し、ファイルサイズに注意して保存した。
  • PDF切り出し工程:ページ単位でスキャンしたPDFを問題単位に切り出す。切り出し後は、検索アプリケーション内の指定フォルダにファイル命名規則に従って保存した。
  • チェック:切り出しルール通りに切り出されているか、抜け漏れはないかのチェックを日本人チェッカーが行う。

2. 過去問データベース~大量データの加工はオフショア・アウトソーシングを活用

株式会社首都圏中学模試センター/三瓶 勇美氏の写真

サイバーテックは、電子化したPDFの模擬試験問題データを検索するアプリケーション開発の提案も実施した。セブITアウトソーシングセンターでは、PHPやJavaなどのプログラム言語を得意とするエンジニアが多数在籍しているため、切り出したPDFを格納する検索システムの開発までワンストップで開発する事が可能であった。その時の様子を山下氏は以下のように振り返る。

「紙の電子化という定型的な作業だけでなく、検索するためのアプリケーションの開発までワンストップでやって頂けるのは、仕様検討や業者への準備の負荷の面で非常に助かりました。電子化から検索までの一連の業務の流れをサイバーテックが理解して、最適な方法を提案していただきました」。

Webアプリケーションの開発は、元々サイバーテックの得意分野であったため、画面構成や検索するために付与する属性の確定もスムーズであった。

「最初にサイバーテックから、検索インターフェースの提案がありました。弊社側は、それに対してコメントをするだけで良く、システム開発の経験がない弊社にとっては非常に楽でした。弊社は、切り出した問題毎のPDFに付与する問題の属性項目を考えて、提示するだけで良く、アプリケーションの機能など技術的な面は全てサイバーテックにお任せしていました」(同社 三瓶氏)。


期間と費用

約4か月の期間と想定費用の半分でデータ加工とアプリケーション開発が完了

同社は、模擬試験の作成や試験の実施で、毎年7月~3月までは繁忙期となる。今回の取組も、業務の繁忙期を避けて行う必要があり、PDFのデータ加工からアプリケーションの開発まで合計4か月間でプロジェクトは完了した。費用についても、海外のアウトソーシングサービスをフル活用する事で、当初想定していた費用の約半分に抑えることができたという。

導入効果

最終ゴールである問題データベース化に向けて

同社の山下氏は、今回の取組の意義と成果を次のように語る。

「今回の取組で紙から電子化という第一歩を踏み出す事ができました。それ以上に重要であったのは、我々自身が、実際のシステムを運用する事で、問題データベースの将来像のイメージをつかむ事ができたことです。文科省の新教育課程や大学受験の方向性にあわせて、中学受験の問題を提供していくには、科目・単元などの従来の問題管理方法では限界があります。今回は属性を仮決めした形で、セブITアウトソーシングセンターをフル活用させて頂き、データ変換と簡単な検索システムがリーズナブルに構築出来ましたが、今後はデジタル化した資産を最大限生かす必要があると考えています。そのためには、柔軟性や拡張性を持った問題データベースが必要になると確信しており、次のステップでは、課題に対応できるXMLデータベース『NeoCore』の技術を生かした取り組みにチャレンジしていきたいと考えています。」

近い将来、同社が問題データベースを活用して社内業務のさらなる効率化の実現と、最先端の教育サービスの提供を行うことは間違いないだろう。

模擬試験の電子化・検索アプリケーション開発概要図

株式会社首都圏中学模試センター様 模擬試験の電子化・検索アプリケーション開発概要図

お客様プロフィール

株式会社首都圏中学模試センター

株式会社首都圏中学模試センター 本社写真
〒101-0051 東京都千代田区神田神保町3-23-2 錦明ビル1F

  • 設立:1990年9月1日
  • 資本金:8,050万円
  • 事業内容:中学入試のための模擬テストの実施

御相談、ご質問はこちら

サービスご案内資料や、特別資料「神は細部に宿る~アノテーションを駆使したAIシステムの精度向上」がダウンロードできます。

最新事例の公開情報や、イベント・セミナー情報をお届けします。

pagetop ボタン
サイバーテックお知らせ画像
©2018 CyberTech corporation ltd. All Rights Reserved.