Label Studioはオープンソースのアノテーションツールです。 Webアプリケーションとして利用でき、わかりやすくシンプルなユーザインタフェースを使って、 画像データ、動画データ、音声データ、テキストデータ、時系列データなどにラベルを付け(アノテーション)、 様々なモデルに合わせたファイル形式で出力することが可能です。
キーボードショートカットやアカウント認証、 プロジェクトの複製など、色々な機能が標準搭載されているので、 アノテーションデータの管理やアノテーション効率の向上が期待できます。
複数プロジェクト、ユースケース、データ型を1つのプラットフォームでサポートでき、Python SDK、Webhook、APIを使って、プロジェクトの作成、タスクのインポート、認証、モデル予測の管理などを行うことが可能です。APIとやり取りするためのtokenを発行することができるので、新しくユーザーが開発した機能をAPI経由で連携することもできます。
また機械学習フレームワーク「ML backend server」と連携することでPre-labeling(アノテーション前の大雑把なラベル付け)、Auto labeling(学習済みモデルを使った自動アノテーション)が可能となります。
自動化ツールを利用して内製しても、人手が足りない、単調な作業で担当者が疲弊する、精度にバラつきがあるという課題がある場合アノテーション代行サービスを利用するのが効率的です。こちらでは、コスパ・対応力・セキュリティなど、重視するポイント別に幅広いアノテーション対応領域に対応している代行サービスを紹介しています。
画像分類、物体認識、セマンティックセグメンテーション、姿勢推定
音声分類、話者分類、感情認識、文字起こし
文書分類、質疑応答、感情分析、固有表現抽出(NER)、要約、HTMLのTagging
イベント認識、時系列分割、時系列分類
文字認識(OCR)、対話処理、音声・ビデオの時系列分類
JSON、CSV、TSV、RAR、ZIP
オープンソースのコミュニティEditionではSlackチャネルかGitHubの問題(Issue)でのコミュニティ・サポートがあります。企業Editionでは、それに加えて、SLA(Service Level Agreement)サポートがあります。
※公式サイトで確認できませんでした
3つの異なる業界と組織で共通の課題を経験したHumanSignalの創設者は知識と経験を共有すればデータ中心のAIの動きが加速すると考え会社を設立しました。 機械学習エンジニアとデータ・サイエンティストとしての経験からデータアノテーションに異なるアプローチを採用したラベリング プラットフォームLabel Studioを開発し、オープンソースとしても提供しています。
運営会社名 | HumanSignal |
---|---|
所在地 | 548 Market St., PMB 34372 San Francisco, California 94104 US |
事業内容 | オープンソースのデータ・ラベリング・プラットフォーム「Label Studio」の開発、販売、提供 |
設立年または創業年 | 2020年 |
問合せ・連絡先 | support@humansignal.com |
営業時間(問合せ対応時間) | 平日9:00~17:00 |
公式サイトURL | https://humansignal.com/ |
画像・動画・言語・音声などの作業領域が適応している代行サービスなら、
一通りのアノテーションは対応してくれますが、
より効率的に作業をすすめたいのであれば、
状況に応じた重視するポイントを把握しておくとよいでしょう。
例えば、限られたAI開発予算のなかで大量のデータ処理が必要な場合は、コスパを重視して選ぶべきですし、
多種多様な言語や医療などの専門知識が必要なデータを処理する場合は、特殊な案件であっても代行可能な対応力を重視して選ぶべきです。
また、秘匿性の高い自社データを扱う場合は、信頼できる直接契約のアノテーターへ依頼ができるなどのセキュリティを重視する必要があるでしょう。
ここでは、画像・動画・言語・音声など、幅広い作業領域に対応できる代行サービスの中から、3つの重視するポイントに合ったサービスをご紹介します。
コストパフォーマンスを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウドに対応
専門アノテーターによる
対応力を重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
― |
責任者による 品質チェック |
〇 |
リモート/オンプレミスに対応
セキュリティの高さを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウド/オンサイトに対応
※選定条件
2023年10月6日調査時点において、「アノテーション サービス」でGoogle検索の表示上限までにでてきた39社の中で、
画像/動画/テキストといった幅広い領域のアノテーションに対応している企業の中から、以下の条件で3社をピックアップしています。
①FastLabel:公式HPに掲載されている料金が最も安いサービス(企業)(画像アノテーション2円(税不明)~)
②アッペンジャパン:公式HPに幅広い言語や専門分野に対応できるアノテータリソースの記述がある(企業)
③ヒューマンサイエンス:セキュリティに関する対策項目が最も多かったサービス(企業)