Build 2018にてMicrosoft Cognitive Servicesのアップデートについて発表がありました。 azure.microsoft.com
実際に利用してみないと詳細が分からないものもありますが、以下に概要をまとめました。 (間違っているものがあればぜひご指摘ください)
Vision
-
英語のOCRモデルの改善(in preview)
キャプションの言語拡張(簡体字中国語、日本語、スペイン語、ポルトガル語)
Custom Vision (in preview)
オブジェクト認識機能を追加
画像内の特定のオブジェクトの正確な位置を認識できるモデルのトレーニングが可能
TensorFlow、CoreML、ONNXの3つの形式でCustom Visionモデルをダウンロード可能
-
- 潜在的な成人向け、不愉快で攻撃的なコンテンツ等にフラグを付けるテキスト分類機能を提供
-
- Azureアカウントに接続可能
Speech & Machine Translation
新しく統合されたSpeech service(in preview)。開発者は一つのエントリポイントで以下にアクセス可能
-
- 音声翻訳パイプラインの3つの要素(音声認識、テキストから音声への変換、機械翻訳)を専用のツールでカスタマイズ可能
特定のハードウェア向けにチューニングしパッケージ化されたSpeech devices SDK(in preview)を利用可能(招待制)
新しいSpeech client SDK(in preview)を利用可能
ニューラルマシン翻訳のカスタマイズのサポート
Microsoft Translator text API (version 3)の更新
Neural Machine Translationを使用して新しいバージョンのサービスをネイティブに公開
インターネット接続がなくても、翻訳機能をどのアプリにも統合できるようにする、新しいMicrosoft Translator機能をAndroid用に発表
Language
-
- テキストからエンティティの識別とリンクを実行する機能を導入
-
- 新しい統合された機能によりスピーチ識別プロセスを簡素化
Knowledge
-
- AzureでQnA Makerを利用可能
Search
Bing Search APIのいくつかの主要な機能を更新
-
- Bing Searchの機能を活用して、特定の製品の類似製品を検索するなどのイメージ機能によるインテリジェントな検索を可能にする新しいサービス
-
- いくつかのBing APIにさまざまな機能を提供するアドイン
-
- カスタムイメージ検索、カスタムサジェスト、特定の統計情報、インスタンスのステージングおよび共有機能を含むBingカスタム検索の更新
Bing APIs SDKの一般公開
Labs
新しくCognitive Services labsを発表し以下の機能を公開
-
- インターネット上で一般に知られている事実や情報を自動的に検索して表示することで、検索エクスペリエンスを向上させる
-
- 特定のURLからウェブページのプレビューを作成できるようにしたり、成人向けコンテンツに抑止するためにフラグを立てることで、ユーザーのソーシャルインタラクションを知らせる
-
- 機械学習によりデータの異常事象を学習する
Project Conversation Learner(招待制)
- サンプルのやりとりから直接学ぶ会話型インターフェイスを構築することが可能
Project Personality Chat(招待制でまもなく利用可能)
- 共通した少しの会話でインテリジェントエージェントの会話能力を強化する
Project Ink Analysis(招待制でまもなく利用可能)
- デジタルインクの認識とレイアウト解析をREST APIで提供する
以下についてはAnnouncementsの中にさらに詳細が書かれています。
- Object Detection with the Custom Vision service
- Build your own one-of-a-kind Custom Voice with the new Speech service
- Perform smart product search with Bing Visual Search