Amazon SageMakerは、さまざまなユースケースのAIモデルを構築できる機械学習プラットフォームです。データ収集からアノテーション、機械学習モデル作成、開発、トレーニング、サーバーの運用・管理・障害対応に至るまでAWS上で実行できるモジュールが用意されているので、Amazon SageMakerを利用すれば複数のシステムを構築して運用する必要がありません。
データにラベル付けするアノテーションは「Amazon SageMaker Ground Truth Plus」や「Amazon SageMaker Ground Truth」モジュールを利用します。画像、動画、テキストファイルなどのデータを識別、ラベリングを行って機械学習モデル用高品質データセットの作成ができます。「Amazon SageMaker Ground Truth」では独自データのラベリングが可能です。 またデータセットの作成にはAWS Marketplaceで機械学習モデルを購入するか、自分で作成した学習用スクリプトをインストールして利用することもできます。
複数プロジェクトのラベリング進捗状況モニタリング、ラベル品質検査、ラベル付きデータのフィードバック、毎日のプロジェクトメトリクス追跡などを行うことができるので、データラベリング品質を向上させることができます。
自動化ツールを利用して内製しても、人手が足りない、単調な作業で担当者が疲弊する、精度にバラつきがあるという課題がある場合アノテーション代行サービスを利用するのが効率的です。こちらでは、コスパ・対応力・セキュリティなど、重視するポイント別に幅広いアノテーション対応領域に対応している代行サービスを紹介しています。
Amazon SageMakerはAIモデルを構築するプラットフォームです。モジュールを組み合わせることでデータの収集、アノテーション、モデル作成、トレーニングの実行、本番環境へのデプロイ、運用というサイクルをまわすフルマネージド型インフラを構築します。
ここではアノテーション(データのラベリング)を行う「Amazon SageMaker Ground Truth Plus」モジュールにビルトインされているアルゴリズム(機能)を紹介します。
Amazon SageMakerを含むAmazon Web Servicesに関係する日本国内でのサポートは日本法人のアマゾン ウェブ サービス ジャパン合同会社が担当しています。公式サイトではAWSのチュートリアルや中・上級者向けのユースケース別ガイド、トレーニングなども利用できます。
Amazon SageMakerには100以上のサービスがあり、構築するサーバーやストレージによって料金体系が異なります。
AWSの具体的な料金については公式サイトで簡易計算することができます。
機械学習の開発、学習、推論環境に Amazon SageMakerを活用してカスタマーサポート用自然言語処理システムを構築。ばらばらでさまざまな問い合わせの中から似たような問い合わせを抽出し、まとめて対応することができるようになったので業務の効率化につながりました。
参照元:amazon公式サイト( https://aws.amazon.com/jp/blogs/news/amazon-sagemaker-fes-10/)
GPUタイプのEC2をオンデマンドで利用していましたがGPU未使用時間が大きなコストロスになっていたことがわかりAmazon SageMakerを導入。 学習インスタンスを利用して必要なときに必要なだけGPUインスタンスを利用することができるようになり、GPUインスタンス利用最適化のよるコスト削減を実現することができました。
参照元:amazon公式サイト( https://aws.amazon.com/jp/blogs/news/amazon-sagemaker-fes-10/)
世界中で広く採用されている包括的クラウドプラットフォームであるアマゾン ウェブ サービス (AWS) にはコンピューティング、データベース、ストレージなどのインフラからAI(機械学習)、IoT、データレイク&分析などニューテクノロジーに至るまで多くのサービスが提供されています。世界の政府機関、企業など多くのユーザーがAWSを利用することでシステムの俊敏性を高め、コストを削減し、技術革新を進めています。
運営会社名 | Amazon Web Services, Inc. 日本法人:アマゾン ウェブ サービス ジャパン合同会社 |
---|---|
所在地 | 東京都品川区上大崎3-1-1 目黒セントラルスクエア17F |
事業内容 | クラウドコンピューティングサービス |
設立年または創業年 | 2006年 |
問合せ・連絡先 | https://aws.amazon.com/jp/contact-us/?nc1=f_m |
営業時間(問合せ対応時間) | 平日10:00~18:00 |
公式サイトURL | https://aws.amazon.com/jp/ |
画像・動画・言語・音声などの作業領域が適応している代行サービスなら、
一通りのアノテーションは対応してくれますが、
より効率的に作業をすすめたいのであれば、
状況に応じた重視するポイントを把握しておくとよいでしょう。
例えば、限られたAI開発予算のなかで大量のデータ処理が必要な場合は、コスパを重視して選ぶべきですし、
多種多様な言語や医療などの専門知識が必要なデータを処理する場合は、特殊な案件であっても代行可能な対応力を重視して選ぶべきです。
また、秘匿性の高い自社データを扱う場合は、信頼できる直接契約のアノテーターへ依頼ができるなどのセキュリティを重視する必要があるでしょう。
ここでは、画像・動画・言語・音声など、幅広い作業領域に対応できる代行サービスの中から、3つの重視するポイントに合ったサービスをご紹介します。
コストパフォーマンスを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウドに対応
専門アノテーターによる
対応力を重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
― |
責任者による 品質チェック |
〇 |
リモート/オンプレミスに対応
セキュリティの高さを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウド/オンサイトに対応
※選定条件
2023年10月6日調査時点において、「アノテーション サービス」でGoogle検索の表示上限までにでてきた39社の中で、
画像/動画/テキストといった幅広い領域のアノテーションに対応している企業の中から、以下の条件で3社をピックアップしています。
①FastLabel:公式HPに掲載されている料金が最も安いサービス(企業)(画像アノテーション2円(税不明)~)
②アッペンジャパン:公式HPに幅広い言語や専門分野に対応できるアノテータリソースの記述がある(企業)
③ヒューマンサイエンス:セキュリティに関する対策項目が最も多かったサービス(企業)