LEKU ONA

エンジニアしたり野鳥を見たりマンガを描いたり

スマホで録った音源からテキスト化に挑戦

結果を先にいうと、求める精度ではなかったのだけど
もったいないので試した経緯だけ残しておきます。

音声ファイルを用意する

  • iPhoneの「ボイスメモ」で録った音声(1時間ぐらい)をAirDropMacに送る
  • m4a から wav に変換する
afconvert -f WAVE -d LEI16 -c 1  XXXXX.m4a XXXXX.wav
  • 実際の音声のはじめ部分
A: よろしくおねがいします
B: よろしくおねがいします
A: といってもどうやりましょうね


Google Speech-to-Text を試す

$export GOOGLE_APPLICATION_CREDENTIALS = XXXXX.json
  • 音声ファイルをGCSにあげておく
$ gsutil cp kakiku.wav gs://bucketsXXX/XXXXX.wav
  • サンプルコードを手元に落とす
$ git clone https://github.com/googleapis/python-speech.git
  • 仮想環境作成し必要なモジュール入れる
$ virtualenv env
$ source env/bin/activate
$ pip install -r requirements.txt
  • サンプルコードに手を加え
-        sample_rate_hertz=16000,
-        language_code="en-US",
-        model=model,
+        sample_rate_hertz=48000,
+        language_code="ja-JP",
+        #model=model,
  • GCS上の音声ファイルをテキスト化してみる
$ python transcribe_model_selection.py gs://bucketsXXX/XXXXX.wav > interview.txt
  • 結果
Waiting for operation to complete...
--------------------
First alternative of result 0
Transcript: お願いします
--------------------
First alternative of result 1
Transcript: 言ってももうやりましょうね
--------------------
・・・・・


Google Speech API を試す

  • 非同期で処理
$ gcloud ml speech recognize-long-running 'gs://bucketsXXX/XXXXX.wav' --language-code='ja-JP' --sample-rate=48000 --async

Check operation [operations/XXXXXXXXXXXXX] for status.
{
  "name": "XXXXXXXXXXXXX"
}
  • 下記コマンドで処理状況を確認。
    終わっていれば progressPercent が100になりresponseにテキストが返る
$ gcloud ml speech operations describe XXXXXXXXXXXXX


{
  "done": true,
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.speech.v1.LongRunningRecognizeMetadata",
    "lastUpdateTime": "2021-09-XXT09:15:37.404790Z",
    "progressPercent": 100,
    "startTime": "2021-09-XXT08:59:39.288851Z",
    "uri": "gs://bucketsXXX/XXXXX.wav"
  },
  "name": "XXXXXXXXXXXXX",
  "response": {
    "@type": "type.googleapis.com/google.cloud.speech.v1.LongRunningRecognizeResponse",
    "results": [
      {
        "alternatives": [
          {
            "confidence": 0.8462801,
            "transcript": "お願いします"
          }
        ]
      },
      {
        "alternatives": [
          {
            "confidence": 0.9102794,
            "transcript": "言ってももうやりましょうね"
          }
        ]
      },
・・・・・
}
  • 結果は同じである


Amazon Transcribeを試す

f:id:background-color:20210905110837j:plain:w400

  • こちらのチュートリアルに沿って画面からアップロードするだけなので簡単
    処理完了後、結果はjsonでダウンロードできる

aws.amazon.com

  • 結果
{"jobName":"sample-transcription-job","accountId":"XXXXXXXXXX","results":{"transcripts":[{"transcript":"よろしくお願いしますふーんって・・・・・}


Googleドキュメントの音声入力を試す

  • ググるとよく出てきた方法
    Virtual Audio Cableなど仮想オーディオで入力を出力に回して、音声ファイルを再生しながら音声入力する方法
  • 結果
言ってももうやりましょうね こっちこそ・・・・・
  • 途中で止まるので無理だった


結果

テキスト化したものは精度的に使えず、手打ちしたのであった‥


精度原因を探る

  • インタビュー形式の2名の音声だったのだが、1名の音声のほうが大きく入っており、そちらばかりテキスト化されていた
    • 一人だけの音声なら、もっと精度が良かったのでは
  • ずっと話し続けていて区切りのない音声だった
    • 区切りが明確な発表形式だったら精度が違ったかもしれない

スマートホーム化 その3

f:id:background-color:20210207095848j:plain
スマートホーム化最終回です。

今までの
back.hatenablog.com
back.hatenablog.com


スマートプラグ

f:id:background-color:20210206150514j:plain
これは、コンセントの間につないで
アプリで設定するだけでOKでした。
簡単すぎてびっくりする。


Amazon Echoに連携

f:id:background-color:20210206151822j:plain:w300
いままで準備したものをすべてAmazon Echoから音声で操作できるようにして、一通り完了です。
これもアプリから操作するだけで設定が終わってしまう。


f:id:background-color:20210206151859j:plain:w300
そして、最後にアクションを設定していきます。
特定の言葉を話したら、指定した複数の処理をしてくれるというもの。

「おやすみ」と言ったら、電気を消して30分後に電気毛布の電源も落とすようにしたり
「おはよう」と言ったら、カーテン開けて今日の天気を教えてくれるように設定してみました。
よい。

人感センサー、温度湿度センサー関連は
配置をちゃんと決めてから設定してみるつもり。

総括

正直めっちゃ便利になったー!という程ではないのですが
(自分の手でやったほうが早いなあ、という時もある)
面白さがありますし
ゴロゴロ寝っ転がりながら一言発するだけで操作できるのは
なかなか良いです。

今後も拡張していきたい。

問題点…?

f:id:background-color:20210207095920j:plain:w500
みんなどうしているんだろう…。

2020年に買ってよかったもの

お題「#買って良かった2020

毎年なんだかんだとやっている
2020年の「買って/やって良かったもの」をまとめました。

プチバスタオル

f:id:background-color:20201219155139j:plain

いつか変えようと思っていたバスタオル。
今年の初め頃に全て「プチバスタオル」という小さなサイズに変えました。

もともと我が家はふたりとも髪が短いし、
大きなバスタオルは不要だと思っていたんですよね…。
おまけに干すとき場所を取るし。

変えてみたところ、想定通りに色々スッキリしました。

購入したプチバスタオルはこちら。一年たった今でも、手触り良く使えています。
ちなみに家で使うタオルは「茶系無地」で揃えてます。
item.rakuten.co.jp


ネイルズインクのリムーバーポット、速乾トップコート

f:id:background-color:20201219170808j:plain
2020年は私のネイル生活を変えた年でした。
なんといっても、このネイルズインクのリムーバー
ポットに指を入れてキュキュッとすれば終わり(この公式Instagramがわかりやすい)

コットンにリムーバーを含めて拭いたら、
他の爪のネイルまで剥がれちゃった。なんてこともありません。

昔、百均で同じ感じのが出でましたが
こちらのほうが匂いがキツくなく(ココナッツオイルぽい香り)
スポンジがしっかりしています。
並んで売ってても、私はこちらを選ぶと思う。

リムーバーと、速乾トップコートがあれば
30分でネイルの塗り直しができるので
気軽に色んな色が試せるようになりました。
濃い色だって塗っちゃう。

濃い色って剥げた時に目立つので、
いままでは余裕がある時しか塗れなかったのですが
今は自由。ネイル生活がとっても楽しいです。


おまけに、ネイルズインクの筆は、大きく先が丸いので
大きめの自分の爪の形にピッタリで塗りやすいんです。

根元の部分がとくに塗りやすいし、
何度も塗り重ねなくていいので、ムラができにくい。
もう私は一生ネイルズインクについていくと思います。

f:id:background-color:20201219164509j:plain
リムーバー、速乾トップコート

秋冬は濃い色を塗りたくなりますね。


椅子。オカムラのコーラル

f:id:background-color:20201219164851j:plain
リモート勤務が多くなってきて
家の硬い椅子では辛くなってきたので、

WORKAHOLIC という色んな椅子を試せるお店で、
アーロンチェアのようなお高いのから、お手軽なのまで試し座りして、
一番しっくりきたオカムラのコーラルにしました。


どんなふうに椅子に座ると疲れないか、
という基本の座り方を教えていただいた上で
店内にある様々な椅子を、好きなだけ試用できるので
とても良かったです。

自分の好みは

  • 座面がクッションで背面はメッシュがいい
  • ヘッドレストは不要
  • 腕は机上に置きたいので、アームレストも無くてもいい

なんてことも分かりました。

毎日座る椅子が快適なのって、ほんと最高です。
あのまま硬い椅子だったら、腰を痛めていたと思います。


椅子の購入を考えている人は、
WORKAHOLICみたいな実際に座ることができるお店に行くの
すごくおすすめです!
予約制だし、椅子が届くまでにも時間がかかるので、体が痛くなる前にぜひ。


ノートパソコンスタンド

f:id:background-color:20201219173858j:plain
https://www.amazon.co.jp/gp/product/B07L8F8MX8/

椅子を買うときに、腕の重さをちゃんと
椅子の肘掛けか机で支えること(肩に負担をかけないこと)と教えてもらい
PCスタンドも使ったほうが良いとのことだったので、購入。

結果とても良いです。
今まで猫背だったんだなあ。

これは折り畳めるのも便利です。


酒ガチャ

KURAND というお店がやってる
定価で何が来るかわからないお酒の福袋的なやつ。
自分は、たしか果実酒多めの一万円で上記。
いろんなお酒が楽しめるので良かったです。美味しかったしお得だし。
また頼もうと思ってます。


&be ファンシーラー

www.cosme.net

私のクマ隠し探しの旅がここで終わった…!
ピッタリの色ですありがとう!

ちゃんと隠せると毎朝鏡見るのが嬉しい。

&beの「素肌をいかす」という思想が好きで
色々他のメイクものも集めてます。

あと、Youtubeチャンネルが参考にもなるんだけど、面白い。大阪のおっちゃん感。
www.youtube.com


ダルトン マグネティック ソープホルダー

f:id:background-color:20201219174152j:plain
https://www.amazon.co.jp/gp/product/B010MYYNCY/

石鹸置きに石鹸を置いておくと
にゅるにゅるしちゃうのだけど、
これは宙に浮かせておける優れもの。

磁石で付いてるだけなので
取り外しも楽です。
あと見た目も良い。


Microplane おろし器

f:id:background-color:20201219175316j:plain
https://www.amazon.co.jp/gp/product/B00151WA06/
細身なので場所も取らず、
刃の向きが一定なので洗うときも拭くときも引っかからないので
危なくないのが、たいへんよいおろし器。
うちでは主にチーズで使用。
硬いチーズの塊もスルスル削れるので、チーズ盛り盛りにできるのがいいですね。


PCバッグ

back.hatenablog.com
今は、ALPAKAのAlphaを使用。
軽くてMacBookも入るので快適です。
通勤がだいぶ楽になりました。
あと多少の雨は平気なのと、ヘットボトル一本ぐらいの追加荷物も受け付ける懐の広さもいい。

ちょっと荷物多いときは、TIMBUK2のClassic Messengerも使用。
この会社日本撤退しちゃいましたねー‥。


iPhone 12 mini

f:id:background-color:20201220221812j:plain
ずっとiPhoneSEを使っていたので、待ってましたのサイズ感。
側面が丸くなくてソリッドなのもよい。
深い青色なのもよい。
出てすぐに機種変更しました。

電池の持ちがだいぶ長くなりまして、写真もキレイに。
端末自体のサイズはそこまで変わらないのに、画面がだいぶ大きくなり快適です。


ヒプノシスマイク

youtu.be
前から存在は知っていたけども、今年唐突にハマってしまった。
好きなエンタメがあるというのは、生活に張りがでますね。
曲聞いてるだけで元気が出る。
舞台やらアニメやらライブDVDやら設定集やら、色々手を出してます。


エアコン

www.corona.co.jp
昨年の夏、寝室にエアコンが無い状態でたいへん寝苦しかったので
今年は事前対策で購入。
すでに、うちにある3台のエアコンが全部CORONAなので同機種を買いました。
時期的に会社名の「CORONA」があんまりよろしくないのか
売り場の端っこの方に追いやられていて
ちょっと悲しかった‥。

CORONAのエアコン、シンプルでお手軽でめっちゃ良いです!
Nature Remo 3でちゃんと操作できるし。


ペピクニックのessential wearシリーズ

www.ropepicnic.com
家にいることが多くなったのだけど
部屋着を持っていなかったので、
楽で着心地いいけど、ちょっとそこまでの外出も可。
という服を探しているときに見つけた服です。
トロッとしてる生地で、着心地がすんごいよい。

テーパードパンツが特に良かったのでこの前買い足しました。
(大きめの私でさえ38でいけるので、みんな38でいいんでは)
(今見たら安くなってて泣いた)


バターで作る/オイルで作る スコーンとビスケットの本(著:若山 曜子)

f:id:background-color:20201220230614j:plain
「ザクザクでバターがしっとり染みるようなスコーンを作りたい!」と唐突に思いついて購入
ポイントを抑えた、少ない材料と手順で作れるレシピが載ってるので大変良い。
なにより美味い。うまい!

何度か作ってざっくり割れるスコーンも作れたし。
色んな味のレシピも作ってみる予定です。


ZEESEAの大英博物館コラボアイシャドウパレット

www.fashion-press.net

自分が持ってるのは#01と#04
使いやすくて意外と馴染む色が多いのとラメの感じも様々で
「今日はどんな感じにしようかな〜」と考えるのが楽しい。

しかし大きいので持ち歩きにはちょっと不向き。
ほしかったときは通販停止しててなかなか手に入れられなかったのに
今はPLAZAとかAmazonで売ってますね。


総括

今年は家時間を快適にするための買い物が多かったように思います。
反対に体験ものが無かったなあ。カメラも買わずじまい。
来年は、今準備を色々進めている、IoT スマートホームまわりを整えられたらよいなあ。
あと購入を目論んでいるのは、ドラム式洗濯乾燥機とせいろ。



昨年の
back.hatenablog.com

スマートホーム化 その2

その1はこちら
back.hatenablog.com


というわけで。
スマートホームを計画しまして、以下のような感じでつなげることに決定しました。
f:id:background-color:20201211224336p:plain

さっそく必要なものを購入。


カーテン

カーテンの自動開閉のために購入したのは
Nature Remo 3mornin’ plus
f:id:background-color:20201217220013j:plain

Nature Remo 3はアプリがシンプルでとっても分かりやすく、
表示に従ってすすめるだけで設定完了。すばらしい。
f:id:background-color:20201217220015j:plain


f:id:background-color:20201216231805j:plain

割と緩やかな動作…。
ルンバが我が家に来たときと同じような
見守る親のような気持ちで毎回眺めてます。

あと、両開きはちゃんと2つつけて左右に開けるほうが良かったです。
はじめは一つで端から端まで開けれるやろ〜と思っていましたが
ちょっと無理させてる感じでかわいそうになってしまったので。


お値段

f:id:background-color:20201216231819j:plain

カーテンの以外はわりとお安くてお手軽なんですが、

カーテンの自動開閉のための機器(mornin’ plusも、SwitchBotカーテンも)
結構お高いんですよね。
モーターが高いんだろうか。

カーテンの自動開閉って
IoTのはじめの一歩として入りやすい部分なのに、値段で躊躇しちゃう人いるんじゃなかろうか。


その3へ続く

スマートホーム化 その1

f:id:background-color:20201212150846j:plain

というわけで、
Amazon Echoを買ってみて、音声操作が面白かったので
部屋のスマートホーム化を計画してみました。


やりたいこと

  • 「アレクサ、おはよう」でカーテンを開けて、今日の天気をお知らせ
  • 「アレクサ、おやすみ」で明かりを消して電気毛布を一時間後に消す
  • 夏は気温によってエアコンと扇風機を操作して、快適室温を保つ
  • 暗くなったら自動でカーテンしめる
  • 人感センサーで自動で明かりが付く

 

調べたこと

カーテン自動開閉できるのは主にこの2つ。
mornin.jp
www.switchbot.jp


アレクサから直接カーテンの開け閉めはできないので
スマートリモコンを間に入れる必要がある。

という組み合わせしか使えない。
カーテン開閉はそこまで差がないので、
スマートリモコンのどちらを使うか検討。

「Nature Remo 3」 vs 「SwitchBotハブプラス」

Nature Remo 3 SwitchBotハブプラス
アレクサと連携
赤外線で家電操作
物理ボタンを押す
-
○(SwitchBotボット)
人感センサー
温度湿度センサー
照度
GPS
-

温度センサー使いたいので、Nature Remo 3 かなー。


完成図

f:id:background-color:20201211224336p:plain

こんな感じでつなげる予定。
スマートプラグは冬は電気毛布、夏は扇風機となる。

スマートホーム化 その2 へ続く。

通勤用のPCバッグを買った

f:id:background-color:20200912171222j:plain

もともと「荷物は軽ければ軽いほうがいい」という信念なので
これまでの通勤時は、財布*1PASMOとハンドタオルが入るぐらいの小さいサコッシュのみで
PCは会社に置きっぱなしでした。

しかし、このところリモートと出社が7対3ぐらいの割合になり
どちらの環境でも会社のPCを使う必要があるため
通勤時につねにPCを持ち歩くことになってしまいました。
PCバッグは重いわ、肩が痛いわで気分も下がりまくり。

というわけで、軽い、そして欲を言えばカッコイイPCバッグを探すぞ。


条件



候補

ALPAKA / Alpha

camp-fire.jp
見た目◎ 機能◎
見た瞬間これだ!と思ったのだけど、随分前に募集期間が終了してた‥。
探してみたけど通常販売はしていない様子。


Topologie / Pacer Messenger Dry

Pacer Messenger Drytopologie.jp
見た目◎ 機能○
見た目シンプルでとってもよい! (カーキーかわいい!)と思ったけど
重さが分からなくて(なんとなくちょっと重そう?)実店舗でみるしかないかな。
「取扱店一覧」はあるけど、どのお店にこのバッグがあるか分からないなあ …むーん。


TIMBUK2 / Classic Messenger (Sサイズ)

timbuk2.jp
見た目○ 機能◎
ちょっとサイズが大きい感。ただバックルで調整できたり、ショルダーパッドついてたり使いやすそう。
マジックテープは個人的にはマイナスポイントかなあ。


moshi / Tego Sling Messenger

moshi-shop.jp
見た目○ 機能◎
コロンとして可愛い!しかし実際使うとこの厚さはどうかなあ。
バックルで調整できたり、意外と機能面が充実してる。


買った

f:id:background-color:20200912171305j:plain
結果。TIMBUK2 / Classic Messenger (Sサイズ) を購入しました。
新宿の店舗にいったら 閉店のため60%OFF で11000円のものが4400円になってたのでつい。


‥…えっ大丈夫なの。
サイトでは渋谷区の店舗は2020年6月21日で閉店したって書いてあったけど
新宿の店舗も閉店しちゃうだなんて…撤退してしまうのだろうか。


背負ったところ(モデル:夫の人)
f:id:background-color:20200912171206j:plain

やっぱりサイズはちょっと大きいかなあ。
でも、軽いのでそんなに気にはならない。


f:id:background-color:20200912171249j:plain
13インチMacBook Pro も問題なく入ります。
(ケースに入れたほうが良さそう)


これで気分を上げて通勤したいと思います!


後日談(2020/09/18)

f:id:background-color:20200918213030j:plain
Classic Messengerの大きさとマジックテープ音が気になってた矢先
ALPAKA / Alpha が買えるところを見つけてしまったので
こちらも購入してしまいました。

比較しながら使っていきたいと思います。

*1:財布も重いの嫌なので軽さ重視のこれ。 https://voi.0101.co.jp/voi/webcatalog/showGoodsDetails.do?wrt=5&mcd=WW625&cpg=649&pno=15&ino=02

*2:☓リュック → 背中に背負うの苦手(山登り時はいいのだが) ☓肩掛けバッグ → 肩痛くなるから苦手なのと、よくあるビジネスバックぽいのもなーという気持ち。

iMessage用のステッカーを作った

f:id:background-color:20200719130624p:plain

iMessage用のステッカーを作りました。

青いうさぎ

青いうさぎ

  • Taeko Saito
  • Stickers
  • Free
apps.apple.com



アプリのリリース周りを少々担当することになったので
自分でもApple Developer Program取って動作テストしていたのですが
このDeveloper Programって結構お高いんですよね。(これ書いてる時点で年間11,800円)

単純にテストだけに使うのもったいないなーと思い
iMessage用のステッカーを作りました。

本当はアプリの一つでも作ればいいのだけど
「これほしい!」というものが思いつかなかったのと
自分の知識がswift2~3あたりで止まっているので
まあ‥もうちょっと勉強し直してから‥
(今みんな何で作ってるの。Unityなの?)


iMessage用のステッカー自体作るのはとても簡単で
こちらを参考に300px×300pxで作成したステッカー画像と
すんごいバラバラのサイズのApp Iconを作成するのみ
qiita.com



ただ、とりあえず上げてみよう〜と
3個のステッカーだけで申請してみたら
見事にリジェクト「4.2 Design: Minimum Functionality」を受けたので
頑張って18個作ってます。



それから申請前にスクリーンショットを登録する必要があるのですが
f:id:background-color:20200719124537p:plain
XcodeのSimulatorとどれが一致するのか分からず
これだけちょっと手間だった。


ここにメモしておきます。

スクリーンショット種類 Simulator
iPhone
6.5インチディスプレイ
iPhone 11Pro Max
iPhone
5.5インチディスプレイ
iPhone 8 plus
iPad Pro (第3世代)
12.9インチディスプレイ
iPad Pro (12.9-inch) (3rd generation)
iPad Pro (第2世代)
12.9インチディスプレイ
iPad Pro (12.9-inch) (2nd generation)

iPad Pro (12.9-inch) (2nd generation)だけ、自分のxcodeの初期設定でなかったので、「add additional simulator ...」 > 一覧の+ボタン > DeviceType: iPad Pro (12.9-inch) (2nd generation) を追加
XcodeのSimulatorを表示させて、⌘ + Sでスクリーンショットが保存できる


アプリの申請まわりを一通り触れたので良かったです。
アプリって作るだけじゃなくて、申請にももうひとハードルありますからね‥。
(ここでは触れていないけど、証明書まわりとか)
google のほうもやっておかねば。