AI分野におけるアノテーション(annotation:注釈)は、画像、動画、音声、テキストなどのデータに属性(メタデータ)やタグを付与して意味づけを行い、AI(Artificial Intelligence:人工知能)が機械学習で理解できるような教師データを作っていく作業です。
教師データとは入力に対応した正解データのことでAIの「教師あり学習」で利用されます。
「教師あり学習」を実施するためには、ある入力に対する正しい出力を学習させなければなりません。例えば通常メールとスパムメールを見分けるためには通常メールの特徴の認識が必要となります。アノテーションでは特徴を抽出して正解データとして作成していきます。
AIを活用したシステムの開発やサービスの適用、ビッグデータ活用などが進められている中、様々なビジネスシーンにおいて目的にあったデータ活用が重要となってきています。そんな状況において、今やアノテーション作業は必要不可欠なものとなっています。
アノテーションが必要となる理由は、機械学習における新しいデータに対し、正しい正誤を導けるようAIに学習させるためです。
AIに機械学習を正しく迅速に行わせるためには、単にAIへ膨大なデータを投入すれば良いというものではありません。 投入されたデータに対し、AIが正しく正誤を引き出せるよう一定のルールを設定し、このルールに従って繰り返し学習させることが必要です。 この一定のルールとなるものが教師データであり、教師データを作成する作業をアノテーションと言います。
教師データが搭載されているシステムでAIに例題と正解を繰り返し学習させれば、 AIは徐々にさまざまなパターン、さまざまな新しいデータにおいて、 正しく正解を導けるようになっていく、ということです。
機械学習を使ったプロジェクトにおいては、いわば「整然と並んだ教師データ」の存在が不可欠。 「整然と並んだ教師データ」とは、アノテーションの誤りや欠損がまったくない教師データです。このような教師データの存在こそが、機械学習におけるAIの精度に大きく関与します。
アノテーションは、機械学習における重要な工程の一つで、AIプロジェクトの成否を大きく左右する重要な要素となります。
アノテーションを行うことで、ビッグデータ整理の効率化につながります。
ビッグデータとは、多種多様な形状・性質を持った巨大データ群のこと。 この巨大データ群をビジネスに活かすためには、それぞれのデータの種類・形状・性質にタグ付けをして整理することが必要です。
アノテーションを多く用意すればするほど、データのタグ付けの効率性・正確性が向上します。
アノテーションによってデータのタグ付けの効率性・正確性が向上することで、AIによる機械学習の精度向上につながります。
AIが膨大なデータから一定の法則を見出すためには、タグが付いたデータを取り込んでパターンを認識させる必要があります。 タグが付いていなければ、AIは正しくデータの学習ができません。 すなわちアノテーションは、AIが正しく機械学習を行うための「前提」とも言えます。
アノテーションは、人間の認識機能をそのまま教師データとして落とし込む作業です。 前提が人間の認識機能である以上、アノテーションは人間の目で確認しながら、人間の手作業で行わなければなりません。 この作業工程には、膨大な作業時間と高度なスキルが要求されます。
画像や動画等の種類・形状・性質に応じてタグ付けを行う作業は、一見簡単に思えますが、 アノテーションの専門知識がない人間で作業をさせた場合、期待した成果を得られないことがあります。
アノテーションは、十分な専門知識とスキルを持つ人間が行うべきでしょう。
実際にアノテーションを行うにあたり、いくつかの方法があります。 以下、「自分でアノテーションを行う」方法と「代行サービスを利用する」方法に分け、それぞれのやり方、特徴を見ていきましょう。
アノテーションは、自分で行うこともできます。
AI作成や機械学習に必要なデータに「ラベル」「注釈」といったタグをつけることでアノテーション作業となります。 ツールにアノテーション機能が搭載されていない場合には、アノテーション機能を搭載したツールに変更したり、 アノテーションライブラリ等から機能を拡張させたりする必要があります。
csvで表を作成している方は、「ラベル」「注釈」欄を追加して入力する必要がありますが、この場合には「ラベル」「注釈」欄がアノテーションであることの紐づけが必要です。
専門業者の代行サービスを利用してアノテーションを行う方法もあります。
迅速かつ精度の高いアノテーションを行う必要があるならば、自分でアノテーションを行うのではなく、高度な知識とスキルのある専門業者に依頼したほうが良いでしょう。
ただし、専門業者にアノテーションを依頼した場合には、一定のコストが掛かります。自社の予算も考慮の上、業者選びを慎重に行いましょう。
業者にアノテーションを依頼する場合には、事前に自社の課題・目標を十分に業者と共有する必要があります。 課題・目標の共有が不十分な場合、スキルのある業者であっても方向性を誤る恐れがあるので注意しましょう。
以上の2つのほかにも、アノテーション自動化ツールを利用する方法やクラウドソーシングを利用する方法などがあります。 いずれの方法にも一長一短があるため、事前にそれぞれの特徴をよく理解の上、自社の目的にマッチした方法を選ぶようにしましょう。
機械学習は人間の知能と同じような働きをコンピューターに行わせようというアプローチです。
人間が経験から学習するようにコンピューターに学習する能力を持たせることで、 コンピューターは新しく入力されたデータに対し、学習結果に基づいた識別や予測をすることができるようになります。
コンピューターに読み込まれた大量なデータを色々なアルゴリズムに基づいて分析することが機械学習の学習方法です。
膨大なデータを繰り返し学習することにより、コンピューターはデータの持つ特徴やパターンを見つけ出していきます。
使用するアルゴリズムは画像識別や売上予測など目的やデータ特性によって異なるため、それぞれの目的に合ったアルゴリズムが必要となります。機械学習の手法は大きく分けて「教師あり学習」「教師なし学習」「強化学習」の3つになります。
また「半教師あり学習」という教師ありと教師なしの中間にあたる学習手法もあります。 それぞれの手法は機械学習の目的やデータの種類によって使い分けられます。
AI開発プロセスの中で様々なデータに意味づけすることがアノテーションであり、 アノテーションされたデータは教師データとなるわけですが、 ここでは教師データを使った機械学習の仕組みについて解説しましょう。
教師あり学習とは、ラベルのついたデータをコンピューターに与えて学習させる手法です。 例えば、AIに猫の写真を見せて「これは何ですか?」という質問と「これは猫です」という答えを教えます。 同じような写真を大量に見せることでAIは猫の特徴をどんどん覚えていき、ある写真を見せ「これは何ですか?」と聞いたときの 「これは猫です」「これは猫ではありません」という正解率が上がっていきます。
このように「これは何ですか?」という問題と「これは猫です」という答えの情報を画像データに次々と付加していく作業がアノテーションとなります。
アノテーション作業は手作業で行われます。 AIも人間同様、学習するほど正解率は上がっていくため、AI精度を高めるには大量の教師データが必要となります。
画像に含まれる特定部分に対してタグ付けを行うアノテーションです。 画像アノテーションの種類には物体検出、領域抽出、画像分類があります。
写真などの画像の中から「車」「木」「人間」などの物体を検出して矩形(長方形)で囲い、それぞれに意味のあるタグ付けをします。
データ1ピクセルごとにタグを設定して領域検出を行いタグ付けを行うアノテーションです。 矩形で囲った物体検出では対象物と関係のない背景なども含んでいるので、 対象物だけを厳密に処理したい場合に行うアノテーションです。 領域検出では、車は赤、木は黄色、人間は緑などのように対象ごとに色分けしてアノテーションしていきます。
猫は動物カテゴリ、人間は人物カテゴリのようにカテゴリ別に分類してタグ付けを行うアノテーションです。画像を見てどのカテゴリに属しているのか判別するだけなので作業コストがかかりませんが、1画像に1カテゴリしか設定できないため、人間や動物が一緒に写っているような画像の場合、細かい判別をすることができません。
動画アノテーションは画像アノテーションの応用となり、動画(映像)データを開始点と 終了点時刻に区切った映像セグメントにし、動画内イベントなどを分類してタグ付けしていきます。
音声アノテーションは音声データを文字に起こしてテキスト化し、 単語ごとに意味をタグ付けするアノテーションです。 音の種類や音量に対してタグ付けを行う場合と、人間の発声する言葉にタグ付けを行う場合があります。 音声中に出てくる商品や家などの名詞だけでなく「ああ!」などの感嘆詞にも1つずつタグ付けしていきます。
テキストアノテーションは特定の文章に前もって定義されているカテゴリを割りつけていくアノテーションで、 文章の一部だけでなく、文章全体にタグ付けすることもあります。 複数システムに分散登録されている顧客データから氏名と住所を抽出してタグ付けしたり、 ニュース記事を政治やスポーツなどのカテゴリに分類したりできるようになります。
さまざまな業界でAIの活用が進む中、アノテーションの需要はますます高まってきています。 その理由としては、次にあげるようなことが考えられます。
ビッグデータとは、様々な形式、種類、性質を持つ巨大なデータ群のことで、 最近ではテクノロジーの進歩によって多様で膨大なデータを扱うことができるようになりました。
社会におけるビッグデータの活用も広がっていますが、データの中には誤ったデータや分類が難しいデータも含まれています。 そのため、蓄積された膨大なデータを分析し活用するにはデータを的確に整理する必要があります。
アノテーションを行うことによって、それぞれのデータが何のデータなのかタグ付けすることができるのでデータを効率的に整理することができます。
AIが膨大なデータの中から一定の法則や特徴を見つけるためには、 タグ付けされたデータを取りこんでパターン認識を促す必要があります。
正確なタグ付けができていなければAIは正しいデータ学習ができません。 AIの機械学習における前工程としてアノテーションは必要不可欠なものとなっています。
様々な分野やビジネスシーンでのビッグデータの活用、人工知能(AI)を使ったシステム開発や運用が急速に進む中、 それぞれの目的にあったデータの活用が欠かせないものとなってきています。 それらのデータを扱う現場で重要な位置を占めるのがアノテーションです。
アノテーションによって対象となるデータに特定の意味を付与することは、 多種多様な大量データの集計・分析を行う上で欠かせない作業であるからです。
AIの学習精度はアノテーションの品質にかかっていますし、またビッグデータを活用するにはデータを迅速・正確に処理できる仕組みが不可欠です。
アノテーションの必要性は、これからもますます増大することは明らかであるといえるでしょう。
AI分野のアノテーションの意味、機械学習の仕組み、アノテーションの具体的な種類、 アノテーションの需要が高まっている背景、アノテーションの必要性について解説しました。
アノテーションは精度の高いAIを開発するために必要不可欠な作業です。 AIは膨大な学習データをもとにして分析・予測を行いますが、そのもととなる学習データがなければ何もできません。 学習データが不正確であったためにAI精度が下がってしまうこともあります。 そのようなことのないよう、アノテーション精度を高めていくことが重要なのです。
画像・動画・言語・音声などの作業領域が適応している代行サービスなら、
一通りのアノテーションは対応してくれますが、
より効率的に作業をすすめたいのであれば、
状況に応じた重視するポイントを把握しておくとよいでしょう。
例えば、限られたAI開発予算のなかで大量のデータ処理が必要な場合は、コスパを重視して選ぶべきですし、
多種多様な言語や医療などの専門知識が必要なデータを処理する場合は、特殊な案件であっても代行可能な対応力を重視して選ぶべきです。
また、秘匿性の高い自社データを扱う場合は、信頼できる直接契約のアノテーターへ依頼ができるなどのセキュリティを重視する必要があるでしょう。
ここでは、画像・動画・言語・音声など、幅広い作業領域に対応できる代行サービスの中から、3つの重視するポイントに合ったサービスをご紹介します。
コストパフォーマンスを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウドに対応
専門アノテーターによる
対応力を重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
― |
責任者による 品質チェック |
〇 |
リモート/オンプレミスに対応
セキュリティの高さを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウド/オンサイトに対応
※選定条件
2023年10月6日調査時点において、「アノテーション サービス」でGoogle検索の表示上限までにでてきた39社の中で、
画像/動画/テキストといった幅広い領域のアノテーションに対応している企業の中から、以下の条件で3社をピックアップしています。
①FastLabel:公式HPに掲載されている料金が最も安いサービス(企業)(画像アノテーション2円(税不明)~)
②アッペンジャパン:公式HPに幅広い言語や専門分野に対応できるアノテータリソースの記述がある(企業)
③ヒューマンサイエンス:セキュリティに関する対策項目が最も多かったサービス(企業)