最近、個人的に面白いと思ったニュース・情報を2つ紹介します。

生成 AI が弱い分野

アラビア語を微妙に崩して検閲をすり抜ける例

1つ目は以下の記事です。

アルゴリズムをすり抜ける言語──AI監視が変えたアラビア語のかたち | WIRED.jp

ネットの記事はしばらくすると読めなくなることもあるので、要点をまとめておくと

  • プラットフォーマーでは AI も使って検閲している
    • テロ等に関する情報はブロックされる
    • 誤検出(過剰にブロックされる、逆に有害情報がブロックされない)も多い
  • アラビア語は柔軟な言語なので、ユーザーは誤検出を避けるために様々な対策をしている
    • 意図的なスペルミスや文字の置換
    • 間接表現
    • 方言
  • AI はそうした対策に弱い

という感じです。年配の方であれば、昔の 2ch で使われていた用語を想像してもらえれば近いのかなと思います。

世界に「発見されていない」日本の80年代ポップス

もう1つは(今検索しても見つからなかったのですが) X で見かけた誰かの投稿で、内容としては生成 AI の作曲ツールに渡辺美里の Believe のようなコード進行の曲を作らせようとしてもなかなかうまく出来なかった、という話です。

と書かれてもピンとこない人も多いと思うので補足しておくと、渡辺美里は80年代〜90年代に当時の若者を中心に圧倒的な人気を誇り現在も活動している女性ポップシンガー(今年還暦だとか)で、Believe は1986年に発表された初期の代表曲の1つです。作曲は今となっては大御所の小室哲哉で、彼らしい転調のある進行です。興味のある方は YouTube 等で聞いてみてください。

さて、なぜこの曲のようなコード進行を生成 AI がうまく作れなかったのでしょうか。前述の通り元投稿が見つからなかったのでどのような指示(プロンプト)だったのか、何を再現しようとしてどう再現できなかったのかの詳細は分かりませんが、考えられる一番の理由としては、日本の楽曲、特に昔の楽曲はあまり学習対象になっていないからでしょう。

日本のポップスの「Aメロ、Bメロ、サビ」がカッチリしてる構成というのは海外のポップスではそこまで多く見られないですし、この曲の各部分単体を見ると、コード進行1つ1つはそれほど珍しくないと思いますが、楽曲全体でこの組み合わせというのはなかなか印象的です。

ここ10年くらいで、70年代後半〜80年代の日本の「シティポップ」が海外で見直されている、みたいな情報を知っている人もいるかと思いますが、80年代の日本のポップスは世界的にはまだまだマイナーです。また、渡辺美里も小室哲哉もシティポップという文脈で出てくることはあまりないと思いますし、彼らの楽曲は80年代には誰もが知っていたとはいえ、今から40年も前の日本国内限定の出来事です。インターネットが一般に広まる前の話で、学習対象となるデジタルデータも少ないはずです。

生成 AI 時代に活かせる教訓(?)

会社のブログ記事なので、これら2つの話から無理矢理教訓めいたものを出してみようと思います。

何度も何度も似たような事を書いていますが、ここ数年の生成 AI の発展により、

「自分の仕事に価値がなくなるのでは」

と不安に思っている人も多いかと思います。世間に流布するその手の話は、誇張されているものも多い反面、本質を突いているものも多くあり、生成 AI が仕事のあり方、ひいては生活の様相を一変させる事は間違いないと思います。

先ほどの2つの事例は、そうした不安への対応のヒントとなるかなと思います。

英語を使う=世界を相手にする

日本以外でも仕事をしたい場合、英語を使える事はほぼ必須となっています。そうした意味では英語を使えることは重要です。

一方、英語で(特にオンラインで)ビジネスを行う・英語でコンテンツを作る、といったものは全て全世界の人が比較対象となり、強烈な競争に晒されます。また、情報量が多いためグローバルで使われている生成 AI の学習対象にもなっていて、生成 AI に代替されやすいという性質があります。

そして、英語のネイティブスピーカーでなく、英語と言語構造が全く異なる日本語を母語とする我々は、そうした土俵では最初からハンデを背負っています。

マイナー言語を使ってそこから逃れられる?

冒頭のアラビア語の例は示唆的ですが、マイナー言語を使うことで生成 AI に支配から逃れられる可能性があります。私は全く話せませんが、アラビア語は「アラビア語」と一括りにするには無理があるくらい地域による違いが大きいと聞いたことがあります。

日本語はどうでしょうか。調べたところ話者数は世界で13位だそうです。

List of languages by total number of speakers – Wikipedia

また、退潮傾向とは言え、日本の経済規模も考えると日本語の重要度はそれなりに高く、実際に OpenAI, Anthropic 等のグルーバル企業の生成 AI でも、日本語の理解力はかなり高いというのは皆さんも気づいていると思います。よほどマイナーな言語だったり、日本語でもマイナーな方言であれば別かもしれませんが、日本語という言語を使ったくらいでは生成 AI の支配からは逃れられなさそうです。

現在、戦略的な観点から、日本語に特化した生成 AI モデル、国産のモデルもどんどん出てきていますし、今後、マイナー言語のモデルも多く作られていくと、マイナー言語を使っているだけでは英語とさほど状況は変わらなくなると思います。

単純な言語ではなく、文脈も含めた言語理解が必要

ということで、より重要なのは言語より文脈かと思います。冒頭の2つ目の例(渡辺美里の Believe)がまさにそうですが、元の X の投稿は単純に

  • 日本語を理解している
  • 歌詞が理解出来る
  • AメロはCm → B♭の繰り返しってのを知ってる
  • サビのところでマイナーキーからメジャーキーへの転調をしている曲は結構多いと知っている

という事実の理解・知識の話をしているのではなく、あの曲が与える印象を体感した上でそれを再現しようとしているという話だと私は理解しました。

本ブログ記事の件名に「独自の『言語』」と括弧付きで書きましたが、言い換えれば、自分の言葉・意見・経験を持つことが大事かなと思います。

余談ですが、そうした「言語」を理解出来るには、ある言語(括弧無し=日本語、英語等)に対する高度な理解が必要なので、子供の日本語教育は重要だなと二児の親として思います。

今後どうなるのか

今後、どうなっていくのかをぼんやり考えてみたので簡単に書きます。

大事な情報は表に出なくなる

ネットの発達によって、既に似たような事が起きています。これだけみんながネットに繋がるようになり些細なことで炎上するようになると、よほどメンタルが強い人でない限りネットで発信する意義が失われてきています。その結果オフラインでの情報やクローズドなコミュニティでのやり取りが増えてきて、ネットで公開される重要な情報が以前ほど増えなくなっています。

似たような事が生成 AI によっても起こりつつあります。 Stack Overflow や note のようにコンテンツを AI プロバイダーに売って稼ぐ企業が出ています。

ただ、それを嫌って、そうしたプラットフォームを避ける、そもそも誰でもアクセス出来るネット上に情報を公開しないという人・企業も増えています。

分断が進む

世の中のグローバル化の進行に伴い、一部のエリートとグローバル化に脅威を感じる大多数の人達で分断が進み、自国第一の動きが各国で出てきているのはご存知の通りです。それについての是非はさておき、生成 AI による影響力に脅威を感じる人も増えてきていて、ちょっと前ですがこんな記事もありました。

アリゾナ大学の学生たちが卒業式でAIの話を始めたエリック・シュミットにブーイングを浴びせる – GIGAZINE

アリゾナ大学は名前を聞いたことがある程度なのでちょっと調べたところ、以下のランキングでは138位でした。この手のランキングは英語圏の大学の方が高くなりがちなのを差し引いても、東北大学が105位、大阪大学が151位なのから考えると、名門校と言って良いと思います。

World University Rankings 2026 | Times Higher Education (THE)

そうした名門校の卒業生はエリート層予備軍と言って差し支えないはずですが、そうした人達も脅威を感じているのは象徴的です。

SF 小説・映画みたいですが、AI の支配から逃れるために人間は潜伏する、小さなコミュニティとして活動し世界が分断する、みたい話が現実になってもおかしくなさそうです。

まとめ

特にまとめるような話もないのですが、生成 AI の動き、それに関連した世界の動きが速すぎて、私も含めて多くの人が不安に思ってます。あれこれ考えてどうにかなる話でもないので、とりあえず仕事は頑張ろうと思います。

お仕事の話等は、以下の問い合わせフォームからお願いいたします。と、雑な締め方をしておきます。

お問い合わせ – もばらぶん