LightTagはラベル付きのコーパスをつくるためのテキストアノテーションプラットフォームです。人手によって行っていたアノテーションの生産性を上げるだけでなく、英語の金融専門用語、アラビア語のツイート、中国語の法律用語、ヘブライ語の医療記録といったグローバルなNLPについても利用できるように設計、構築されています。
※NLP(Natural Language Processing/自然言語処理):人間が日常的に使う言語を機械で分析すること。形態素解析、構文解析、意味解析、文脈解析の流れで処理される。
※コーパス:テキストや本、雑誌、映画、テレビなどで使われる発話を大量に集めて検索できるようにデータベース化した言語資料。
LightTagはアノテーターの生産性があがるように最適化された使いやすいUXで設計されています。マウスやキーボードで簡単にアノテートでき、スピーディに作業できるためのキーボード ショートカットも豊富に用意されています。アノテーターは、必要に応じて、単語や語句に自由にラベル付けができます。
大量データのラベリングをアノテーター一人で行うことは難しいですが、LightTagはチームアノテーション作業を可能にするツールで、アノテーションタスクを定義し、それぞれアノテーター数を指定できます。アノテーターへの作業割り当て、稼働管理、アノテーションの達成目標設定、プロジェクト分析もできるのでパフォーマンスの悪いタスクもすぐに発見することができます。プロジェクトの実行・管理ができることで、専門知識が必要であるためにアウトソーシングできないようなアノテーション作業も社内で行うことができます。
自動化ツールを利用して内製しても、人手が足りない、単調な作業で担当者が疲弊する、精度にバラつきがあるという課題がある場合アノテーション代行サービスを利用するのが効率的です。こちらでは、コスパ・対応力・セキュリティなど、重視するポイント別に幅広いアノテーション対応領域に対応している代行サービスを紹介しています。
公式サイトにFAQページがあります(https://www.lighttag.io/FAQ/)。またLight Tagヘルプセンターでアドバイスや質問に対する回答を得ることができます(https://help.lighttag.io/en/)。
※資格のある教育機関で教える人が非営利研究に使う場合は無料で使用できます。
ある製薬会社では、2つ以上の薬物について記載されている場合、「ザナックスとアルコールを混ぜないでください」というように相互作用する薬物ペアを抽出し、薬物間相互作用 (DDI) のコーパスを構築するためにLightTagを導入。
個々の薬剤に事前に注釈付けをし、強調表示された薬剤ペアを一度に表示できるようにすることでプロジェクトのリードタイムを減少させることができました。アノテーターの認知的負荷が軽減され、エラーリスクも減ったことでスピーディな作業ができるようになりました。
参照元:LightTag公式サイト( https://primer.ai/developer/say-goodbye-to-annotation-lead-times/)
2015 年に設立されたPrimer Technologies, Inc.はML(機械学習)の会社です。自然言語処理技術を使用して顧客のインテリジェント・ワークフローの拡張や最適化をサポートします。
※アノテーションツール「LightTag」はTal Perryが2017年に設立したLightTagの製品でしたが、2022年2月に顧客であったPrimerに買収され、Tal Perryは同社の主任プロダクト・マネージャーとなっています。
運営会社名 | Primer Technologies, Inc. |
---|---|
所在地 | 記載なし |
事業内容 | 自然言語処理、機械学習テクノロジーを使ったAIシステムの開発・販売 |
設立年または創業年 | 2017年 |
問合せ・連絡先 | https://primer.ai/contact/ |
営業時間(問合せ対応時間) | 記載なし |
公式サイトURL | https://primer.ai/ |
画像・動画・言語・音声などの作業領域が適応している代行サービスなら、
一通りのアノテーションは対応してくれますが、
より効率的に作業をすすめたいのであれば、
状況に応じた重視するポイントを把握しておくとよいでしょう。
例えば、限られたAI開発予算のなかで大量のデータ処理が必要な場合は、コスパを重視して選ぶべきですし、
多種多様な言語や医療などの専門知識が必要なデータを処理する場合は、特殊な案件であっても代行可能な対応力を重視して選ぶべきです。
また、秘匿性の高い自社データを扱う場合は、信頼できる直接契約のアノテーターへ依頼ができるなどのセキュリティを重視する必要があるでしょう。
ここでは、画像・動画・言語・音声など、幅広い作業領域に対応できる代行サービスの中から、3つの重視するポイントに合ったサービスをご紹介します。
コストパフォーマンスを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウドに対応
専門アノテーターによる
対応力を重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
― |
責任者による 品質チェック |
〇 |
リモート/オンプレミスに対応
セキュリティの高さを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウド/オンサイトに対応
※選定条件
2023年10月6日調査時点において、「アノテーション サービス」でGoogle検索の表示上限までにでてきた39社の中で、
画像/動画/テキストといった幅広い領域のアノテーションに対応している企業の中から、以下の条件で3社をピックアップしています。
①FastLabel:公式HPに掲載されている料金が最も安いサービス(企業)(画像アノテーション2円(税不明)~)
②アッペンジャパン:公式HPに幅広い言語や専門分野に対応できるアノテータリソースの記述がある(企業)
③ヒューマンサイエンス:セキュリティに関する対策項目が最も多かったサービス(企業)