音声認識を使い倒すと言う試み

最近家にあるいい感じの安楽いすにタブレットアームをつけた。これは結構良いのだが、文字入力がめんどくさいと言う問題があった。また、自分は何か考え事をする時、テキストにまとめたりするのだけれど、整った文章を書こうと言う意識に引きずられて考えの内容のほうに意識が向いていないなと思うことがままある。

これらの問題をいちどに解決するのに、音声認識機能で文字起こしをすることが有効なのではないか。そう考えて昨日あたりから試し始めている。この試みは7割程度うまくいっているように感じる。キーボードを叩いたりするのではなく、考えている対象について意識を向けながら目の前に表示される自分の考えを反芻する。どうせ完璧な文章は、このやり方では作れないので、つらつらと発散的な考えを行うのには余分な神経の使い方をせずに済んでいる。

じゃぁ残りの3割は何なのかと言うと、多分この文章を読んだ人にはある程度わかっているのではないだろうか。この文章はほぼ口述に基づいて書かれていて、キーボードを使っていない。見ての通り大変散漫な文章である。下書き、あるいは下書きの下書きを作るために、自分の中にあるものを一旦ダンプする場合には、これは問題にならない。しかしiPadの自動文字起こし機能はおばかである。ちょっと難しい語彙を出すとすぐに全然違う変換をしてしまう。機械学習マルコフ連鎖か何かそういう技術を使っていて、この話の流れならこの単語が出るだろうと言うようなものが文字起こし処理の中で使われているように感じられる。結果として、いくらはっきりと言い直したとしても、iPadが信じる自然な流れに反する単語が登場した場合、かたくなに変換結果を変えようとしないことがある。今出した語彙という言葉も、最初は全然違う単語として変換されていた。こういうところに神経を使っていると、一旦集中が削がれてしまって、ダンプ処理が妨げられてしまっているような気がする。

7割はうまくいっているので、このやり方はもうしばらく続けてみたいと思っている。けれど、残り3割の欠点は結構大きいので、そのうち嫌になってやめてしまうかもしれない。そうなる前に劇的なバージョンアップが入って、これらの欠点がいちどに解消してしまえば嬉しいのになぁ。これは願望です。

技術でなんとかするならば、この文章を生成AIに丸投げして編集や構成を勝手にやってもらえたら便利そうである。しかしガーベッジインガーベッジアウトであるから、変換等がガタガタなものが入力されてしまえば生成AIも結構困るのではないか。まぁこんなことをうだうだ言っているよりさっさと試してみろと言うのはもっともな話なので、気が向いたらやってみようと思う。

おまけ

使っている安楽いすは、IKEAで売られている以下の製品だ。お値段の割にすわり心地が良いのでお勧め。ただし長く使っているとだんだんボルトが緩んでくるので適宜増し締めをするという注意は必要。この辺は値段なりだなと思う。

https://www.ikea.com/jp/ja/p/poaeng-armchair-birch-veneer-knisa-light-beige-s19240788/