画一的な学習データではなく、AIで何を行うための学習データなのか、どのような効果が期待されているのか、などお客様とのコミュニケーションを密に取りながらニーズに合わせた柔軟なアノテーションを行い、高品質な教師データを作成します。
動画や画像にメタデータ(情報タグ)を付加して教師データを作成するアノテーションでは、機械学習エンジニアと専任アノテーターが連携しながら仕様を策定しルール決めを行います。そのため余分な作業やコストを抑え、高品質のアノテーションデータを作成することができます。
AIモデル開発の要となるデータアノテーションは専門会社で実施されることが多いです。
しかしNextremerではAIの課題設定・AIデータ仮説構築、データ収集、アノテーション、AIシステム開発、保守・運用まで全て内製化してるのでAIモデル構築から開発まで、低コスト・短納期で実現することが可能。
AIトレーナーによる専任チームが要件定義から品質管理まで一貫して実施し、AI導入から運用まで手厚くサポートします。
データアノテーションを利用し以下のようなAI技術に対応しています。
テキストの文章や段落に対し事前定義された分類項目をもとにしてタグ付けを行います。
ニュース記事をスポーツ、政治などのカテゴリに分類する、PDF文書から特定情報を抽出するなどが可能になります。
テキストと音声内容の整合性確認、音声の書き起こしを行います。音声会話に出てくる「親」などの名詞だけでなく「悲しい」などの感嘆詞、「ええと」「あのー」などの相づちにもタグ付けしていきます。
※その他のデータについては要相談
アノテーション作業は専任アノテーターと機械学習エンジニアが連携して作業を行いますが、作業工程は以下のようになっています。
参考書、書面、音声保管議事録などもアノテーションデータになりますが、お客様が用意できない場合はネクストリーマーで用意することも可能です。
アノテーション用に新規に写真や動画を撮影するなど、データ収集方法についても綿密に相談して進めていきます。
公式サイトに記載はありませんでした
アノテーション目的…作業効率化を図るためのデータ収集
作業内容…作業者の「右手の作業対象箇所」「左手の作業対象箇所」「右手作業内容」「左手作業内容」「右手が持っている物」「左手が持っている物」「歩いているかどうか」の注釈付与
期間…約4か月
データ収集総量…動画約35時間
利用アノテーションツール…ELAN
参照元:Nextremer公式サイト(https://www.nextremer.com/annotation#annotation_about)
※2023年10月調査時点HPが移転し、事例は確認できませんでした。
アノテーション目的…動物の動きによって飼養管理するAIカメラの研究開発用データ収集
作業内容…放牧羊1頭ごとにバウンディングボックスを付与、放牧された羊1頭ごとにバウンディングボックスを付与「座る」「立つ」「餌を食べている」など状態やポーズの注釈を付与
期間…半年以上
データ収集総量…画像10万枚以上
利用アノテーションツール…CVAT:Computer Vision Annotation Tool(Intel社製)
参照元:Nextremer公式サイト(https://www.nextremer.com/annotation#annotation_about)
※2023年10月調査時点HPが移転し、事例は確認できませんでした。
「Next(次を創る)」と「Extreme(最先端/極限)」を組み合わせた造語「Nextremer」。
その社名には失敗を恐れず挑戦し次を作り続けるという思いが込められています。
創業時のAI受託研究開発から様々な企業や研究機関と共同研究などを経て、独自対話エンジン開発、 AIプロダクトへと進化の道を選んできたネクストリーマー。
技術革新の急速な進歩でデータにより新たな価値が生まれ、さらなる可能性が広がる中、将来のソフトウェア×ハードウェアの融合加速化を踏まえたAIソリューション、アノテーションサービスを提供し続けています。
運営会社名 | 株式会社Nextremer(ネクストリーマー) |
---|---|
所在地 | 高知県南国市蛍が丘1-1-2 南国オフィスパークセンター別棟 3F |
事業内容 | AI学習データ提供事業(自社データ・カスタマイズデータ) AI学習データの収集・アノテーション ・プラットフォーム提供事業 |
設立年または創業年 | 2012年 |
問合せ・連絡先 | https://www.nextremer.com/contact |
営業時間(問合せ対応時間) | 記載なし |
公式サイトURL | https://www.nextremer.com/ |
画像・動画・言語・音声などの作業領域が適応している代行サービスなら、
一通りのアノテーションは対応してくれますが、
より効率的に作業をすすめたいのであれば、
状況に応じた重視するポイントを把握しておくとよいでしょう。
例えば、限られたAI開発予算のなかで大量のデータ処理が必要な場合は、コスパを重視して選ぶべきですし、
多種多様な言語や医療などの専門知識が必要なデータを処理する場合は、特殊な案件であっても代行可能な対応力を重視して選ぶべきです。
また、秘匿性の高い自社データを扱う場合は、信頼できる直接契約のアノテーターへ依頼ができるなどのセキュリティを重視する必要があるでしょう。
ここでは、画像・動画・言語・音声など、幅広い作業領域に対応できる代行サービスの中から、3つの重視するポイントに合ったサービスをご紹介します。
コストパフォーマンスを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウドに対応
専門アノテーターによる
対応力を重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
― |
責任者による 品質チェック |
〇 |
リモート/オンプレミスに対応
セキュリティの高さを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウド/オンサイトに対応
※選定条件
2023年10月6日調査時点において、「アノテーション サービス」でGoogle検索の表示上限までにでてきた39社の中で、
画像/動画/テキストといった幅広い領域のアノテーションに対応している企業の中から、以下の条件で3社をピックアップしています。
①FastLabel:公式HPに掲載されている料金が最も安いサービス(企業)(画像アノテーション2円(税不明)~)
②アッペンジャパン:公式HPに幅広い言語や専門分野に対応できるアノテータリソースの記述がある(企業)
③ヒューマンサイエンス:セキュリティに関する対策項目が最も多かったサービス(企業)