目次
自動要約の展望
Amazon Transcribeで文字起こし→話題のELYZA長文要約で直近のエピソードを要約してみた結果。
— 白金鉱業.FM (@shirokane_fm) August 27, 2021
日本語podcastの要約にはまだ文字起こし精度が足りぬ...1つ目のとかは上手く要約できててELYZAすごい pic.twitter.com/V6RDzMXOSq
- 元ツイートは Amazon Transcribeで会話の文字起こしを行い、それをELYZAで自動要約を行ったというもの
- Amazon Transcribeには話者分離の機能があり、議事録作成には一歩秀でているか?
- しかし、対話分を要約するデータセットというものが用意しにくいという問題があり、生成系のようやくモデルは不自然な出力が得られる事が多い。
- そもそも一つの対話文から一つの要約が得られるのか?という根本的な問題設定にも課題がある
- つまり、データセットを作成する際に特定の作業者による偏りが生じないように複数の作業者によって作成されたデータの平均を取ることをする
- しかし、出力が選択肢ではなく、自由作文の形式のときに正解とはなにか?を正しく設定することが難しい
- そういうのめんどくさいし、ウィキペディアのデータでええやんというのが2021年時点では多く見られる
- もちろん英語の場合には更にデータが用意されることもある
- 問題はウィキペディアは会話の形式ではないということ
- これは単純に形式だけの問題なのか、人間が言語を用いて会話するときには特殊なルールが存在するのか、そしてそのルールはデータのみから学習できるのか?
- 出力の自然さ自体は学習におけるチューニングでなんとかなりそう
- T5やGPT-2などはとても自然な文章を出力する
- ということは見た目はそれらしいものを得ることができる
- では中身においてはどうか?というと人間がみて判断するのが現時点の状況である
- 中身があっているかどうか?という評価基準が必要だよね、という話は機械翻訳の文脈でもされており、事前学習により単語の意味を学んだモデルを用いて文と文の類似度を出すというアイデアがある
- BERTをもちいた評価指標
- しかしBERTがどれだけ信頼できるのか?その評価方法は妥当なのか?など疑問はあり、一般的な指標としては未だにトークン列の一致度を用いることが多い
- 中身があっているかどうか?という評価基準が必要だよね、という話は機械翻訳の文脈でもされており、事前学習により単語の意味を学んだモデルを用いて文と文の類似度を出すというアイデアがある
顔の自動生成モデル 結構人種のバイアスがありそう
Face Depixelizerが暴く,MATLABの正体! pic.twitter.com/UqgRMFxan8
— MATLAB'zのLIVE Editorにようこそ! (@nonlinopt) September 4, 2021
- いわゆる機械学習モデルの惰弱性を突くとこういう愉快な結果になる
- 理屈の上ではこのモデルを一種のブラックボックス関数とみなして、出力結果を任意の顔にすることもできるだろう
- 顔のパターンなんかは意外と勾配情報に落とし込むことができるのでは?
- だとするといろいろな最適化アルゴリズムが適用できる
- 顔のパターンなんかは意外と勾配情報に落とし込むことができるのでは?
- 冗談として解釈することもできるが、セキュリティの観点からすると問題点が見えてくる
- 機械は人の顔を正しく認識しているといえるのか?
- 任意の顔や模様を作り出せてしまうことで悪用の危険性はないのか
- そもそもおかしな挙動をしないようにコントロールするべき?
アドベンチャーワールドのパンダ 楓浜 元気
とろけるふうひん♪ pic.twitter.com/7JUFi5Fu59
— アドベンチャーワールド 公式 (@aws_official) September 4, 2021
- アドベンチャーワールドのパンダはよく子供を産むイメージがある
- パンダの名付け親になりたいならアドベンチャーワールドの広報には目を光らせておいたほうがいい
- 上野動物園でも繁殖に成功している
- パンダって意外と赤ちゃんおいてご飯を食べに移動するんだな、というのは意外な印象
- でも赤ちゃんにつきっきりの動物って意外と少ないか?
- ペンギンくらい?
写本って意外と知らない でも写本があるから現代に残っている文献も多いハズ
ベルンハルト・ビショッフ著、佐藤彰一/瀬戸直彦訳『西洋写本学』(岩波書店)が届きました。
— きけろう@ラテン語学習者 (@Cicero_Orator) September 2, 2021
古代・中世書物学の基本書とのことですが、文献一覧や精選文献目録、日本語文献案内にびっちり60ページ分書物の案内があり、この本を読んだ後の研究活動も捗りそうです。
これからじっくり読んでみます。 pic.twitter.com/GKSBP6B9tS
- 恥ずかしながら、写本については本当に知識がない
- ベルセルクで団長がやってたっけ?くらいの感覚
- あとはクトゥルフ神話系のアイテムとして〜写本ってでてくるくらい?
- というか西洋に限らず、日本でも源氏物語とか書き写されまくってたっけか?
- 後付の話も結構あったような?
なんとなく初期のプログラマーは女性が多かったという話を思い出した
コンピュータから出てくる紙テープ(鑽孔テープまたは穿孔テープとも呼ばれるそうだ)を読める人になりたいと、子供のころに夢見ていました。
— 中井かんいち (@ichikawakon) September 2, 2021
『ウルトラマン』などに出てきましたよね。いまだに紙テープを読めるのはカッコイイと思っております。 pic.twitter.com/Wlxz731HjS
- 核開発の産物の一つとして計算機が挙げられる
- ファインマンが核開発を行っていた当時の計算機はパンチカードを用いたものだった
- それが時代を経てフロッピーになり、HDDになり、DVDになり、今ではSSDか?
- そもそものプログラミングの方法そのものがガラッと変わっているし、職業に対する先入観も大きく変わっている
- なんせ小学生に教えないといけませんからね
身近な熱力学?
この実験は科学技術館の方がやっていた実験ですが、、、
— てるる (@tellurium_sci) September 2, 2021
「いろはす」のペットボトル、実はすごいんです。
(消毒用アルコールを霧吹きで少し入れています。) pic.twitter.com/5HQrMtSFBJ
- 断熱圧縮で紙切れを燃やすという実験は見たことがある
- これはその逆かな?
電話はデジタル
実家から「今夜の虫の鳴き声すごいよ!今電話向けるね」と電話かかってきた。クツワムシとかかなぁ…って思いながら待ったけど風の音しか聞こえてこない。
— HODAKAHORA (@shoebill_hoda) September 1, 2021
お?これはもしや!?となって「スズムシ?」って聞いたらアタリだった。昔からよく聞く雑学だけど初めて体感したよ、電話の可聴周波数帯外。
- 今どきは電話の音声はデジタルに変換されているからじつは声色の違いは数パターンに集約されているという話を聞いたことがある
- 同じ理屈で人の声を特徴づける部分からはずれた音は切り捨てられているんだなぁ
エスコンやってたら多少わかるネタ
— ミサイる (@Missilebox_One) August 30, 2021
くずし字を読み取るためのアプリが公開された つまり文献の内容だけを読み解くスタイルが現れる?
機械学習で古文書のくずし字を読み取れるアプリ「みを」、正式公開(Impress Watch)#Yahooニュースhttps://t.co/IFDLDdw08l
— 勉誠出版編集部 (@bensey_edit) August 31, 2021
- 古い文献を使った研究をする際に文字や言語の壁がある、という話
- このアプリはその壁を崩す一助になるだろうか?
- 時代や文化的背景によってモデル変えたほうが精度がでるかもという指摘があったが、それは本質的ではないと考える
- 単純に精度を出したいというモチベーションで発表されているわけでないので、それは論点が違う
- iPodが出たときにこんなのしょーもねーといった人種に近いか?
- 世界初かどうかだけが評価基準ではないんですよね
- 細かいあらはどうせ時間が経って関係者が増えれば熟れていくのだから些事にすぎない
- 精度を上げる研究はむしろ他の研究者が率先してやるべき
- 時代や文化的背景によってモデル変えたほうが精度がでるかもという指摘があったが、それは本質的ではないと考える
- 文字の筆跡から情報を汲み取る手法もある気がするので頼り切りになると研究の幅が狭まるとは思う
- ひとつの派閥として純粋に文献の情報のみを扱うという抽象度ですすめるというのは面白くなるだろう