Microsoftがハンズフリー入力をサポートするOffice用(Word、PowerPoint、Outlook)のアドイン「Dictate」をリリースしました。
- Type with your voice using Dictate, a new Microsoft Garage project – The Fire Hose
- https://blogs.microsoft.com/firehose/2017/06/20/type-with-your-voice-using-dictate-a-new-microsoft-garage-project/
- Officeで音声入力できる「Dictate」が公開–リアルタイム翻訳は60言語に対応 – CNET Japan
- https://japan.cnet.com/article/35103040/
Dictateは、Cortanaの音声認識技術を使って、マイクに向かって話した言葉をテキストに変換し、そのままOffice文書に入力、さらにリアルタイムで翻訳を行うこともでき、例えば、日本語で話した内容の翻訳結果を直接Office文書に入力することができます。
上の動画は、WordとPowerPointでDictateアドインを使用したときの様子をキャプチャーしたものですが、これを見ると、日本語で音声入力した内容が中国語や英語に翻訳され、文書に入力されていることが分かります。
もちろん、下の動画のように日本語をそのまま入力することもできます。
Dictateのシステム要件
Dictateアドインのシステム要件は下記の通りです。
- OS:Windows 8.1以降
- Office:Office 2013以降(32ビット版、64ビット版両対応)
- .NET:.Net Framework 4.5.0以降
私は下記環境で動作確認を行いました。
- OS:Microsoft Windows 10 Pro 10.0.14393 ビルド 14393
- Office:Microsoft Office Home and Business 2013 15.0.4937.1000 32ビット
Dictateのインストール
Dictateは下記の手順で簡単に導入することができます。
- 公式サイトにアクセスします。
- 「Download for Office 32-bit」ボタン(64ビット版Officeを使っている場合は「For Office 64-bit click here」)をクリックし、インストーラーをダウンロードします。
- 手順2.でダウンロードしたインストーラーを実行し、指示に従ってインストールを行います。
- Officeアプリケーション(Word、PowerPoint、Outlook)を起動し、「Dictation」タブが追加されていれば、インストール終了です。
音声入力による操作
音声によるテキスト入力は上の動画で紹介した通りですが、Dictateは音声入力によって、Officeのコマンドを実行することもでき、下の動画では「new line」(改行)と「stop dictation」(音声入力停止)を実行しています。
いまのところ実行できるコマンドは下記の通り(英語のみ)で決して多くはありませんが、今後のバージョンアップで増えていくかもしれません。
- New Line: Takes cursor to new line
- Delete: Removes the last line you dictated
- Stop Dictation: Terminates the dictation session
- Full stop or period: Types period character (.)
- Question mark: Types (?)
- Open Quote: Types (“)
- Close Quote: Types (”)
- Colon: Types (:)
- Comma: Types (,)
Dictateの仕組み
「Type with your voice using Dictate, a new Microsoft Garage project」に書いてある通り、Dictateは、Bing Speech APIやMicrosoft Translatorなどの、Microsoft Cognitive Servicesに組み込まれた最先端の音声認識と人工知能を使用しています。
Dictateアドインの実行中にネットワークキャプチャーしてみると、各APIが呼び出されているのがよく分かります。
Dictateの対応言語
現時点(2017/6/21 時点)では、Dictateは下記言語に対応しています。
音声入力(From)
- Arabic (Egypt)
- Chinese (China)
- Danish (Denmark)
- Dutch (Netherlands)
- English (Australia)
- English (Canada)
- English (India)
- English (United Kingdom)
- English (US)
- Finnish (Finland)
- French (Canada)
- French (France)
- German (Germany)
- Hindi (India)
- Italian (Italy)
- Japanese (Japan)
- Korean (Korea)
- Norwegian (Norway
- Polish (Poland)
- Portuguese (Brazil)
- Russian (Russia)
- Spanish (Mexico)
- Spanish (Spain)
- Swedish (Sweden)
リアルタイム翻訳(To)
- Afrikaans
- Arabic
- Bangla
- Bosnian
- Bulgarian
- Cantonese (Traditional)
- Catalan
- Chinese
- Chinese Simplified
- Chinese Traditional
- Croatian
- Czech
- Danish
- Dutch
- English
- Estonian
- Fijian
- Filipino
- Finnish
- French
- German
- Greek
- Haitian Creole
- Hebrew
- Hindi
- Hmong Daw
- Hungarian
- Indonesian
- Italian
- Japanese
- Kiswahili
- Klingon
- Korean
- Latvian
- Lithuanian
- Malagasy
- Malay
- Maltese
- Norwegian
- Persian
- Polish
- Portuguese
- Queretaro Otomi
- Romanian
- Russian
- Samoan
- Serbian (Cyrillic)
- Serbian (Latin)
- Slovak
- Slovenian
- Spanish
- Swedish
- Tahitian
- Thai
- Tongan
- Turkish
- Ukrainian
- Urdu
- Vietnamese
- Welsh
- Yucatec Maya
Dictateの実体
私の環境で確認したところ、Dictateをインストールすると、「C:\Program Files (x86)\Microsoft\Dictate 1.0」フォルダに下記ファイルが作成されました。
- CoginitiveFacade_64.dll
- Microsoft.Office.Tools.Common.v4.0.Utilities.dll
- Microsoft.Office.Tools.dll
- Microsoft.Office.Tools.Outlook.v4.0.Utilities.dll
- Microsoft.Office.Tools.v4.0.Framework.dll
- Microsoft.Threading.Tasks.dll
- Microsoft.Threading.Tasks.Extensions.Desktop.dll
- Microsoft.Threading.Tasks.Extensions.dll
- OutlookDictation64.dll
- OutlookDictation64.dll.config
- OutlookDictation64.dll.manifest
- OutlookDictation64.vsto
- PowerPointDictate_64.dll
- PowerPointDictate_64.dll.config
- PowerPointDictate_64.dll.manifest
- PowerPointDictate_64.vsto
- SpeechClient.dll
- TextProcessor.dll
- WordDictate.dll
- WordDictate.dll.config
- WordDictate.dll.manifest
- WordDictate.vsto
これを見ると、DictateはVSTOで作成されたOfficeアドインであることが分かります。
Dictateの注意点
上記の通りDictateの動作はWeb API有りきとなっているため、ネットワーク非接続の環境では、「Unable to create MicrophoneRecoClient」「Unable to start, please try again after some time」といったエラーが発生し、使用することができません。
おわりに
CNET Japanの記事にある通り、DictateはMicrosoft Garageによる実験的なアドインであるため、今後正式にサポートされる製品であるかどうかは分かりません。
ただ、Dictateの動作は軽快で安定しており、音声入力・翻訳機能は非常に便利で強力です。
WordやPowerPointで資料を作成される方、特に他言語で資料を作成する機会が多い方にはとても役立つツールだと思いますので、興味がある方は是非一度お試しください!
この記事へのコメントはありません。