とぷすけの書斎

障子を開けてみよ、外は広いぞ。

投稿者: topusuke

  • ボカロ文化の「再燃」について

    椎名もた – 少女A YouTubeより

    さて、少女Aが2億再生を突破したこの機会にボカロのお話でも書こうかと思った。

    あまり少女Aに今回の主題である「再燃」というのを使うの憚られる気もするが、許していただきたい。

    なぜ「再燃」なのか

    別に、元々下火になってた?という方もいるかもしれない。けれども、私は再燃という言葉を使いたい。

    2017年、ハチ(米津玄師)による楽曲「砂の惑星」がその年のマジカルミライのテーマソングであった。

    何もない砂場飛び交う雷鳴
    しょうもない音でかすれた生命
    今後千年草も生えない 砂の惑星さ

    こんな書き出しで始まる曲をマジミラに出したら炎上するも当然である。
    が、この年の再生回数が最も多いボカロはこの曲であった。(その後、再生数はのび続け2021年にグッバイ宣言が出るまでyoutube上の総再生ランキングは1位である。)

    極端に下火であったかというと微妙だが、「衰退期」なんて呼ばれていた。

    2020年、ボカロブームへ

    この話をするにあたって、次を見てほしい。

    以下は一億再生を超えているボカロ曲である。

    曲名ボカロP投稿日所要日数*1
    グッバイ宣言Chinozo20/04/132年と105日
    ECHOCRUSHER-P14/10/089年と334日
    少女A椎名もた13/10/1711年と73日
    愛して愛して愛してきくお15/03/0610年と28日
    強風オールバックゆこぴ23/03/151年と248日
    メズマライザーサツキ24/04/27204日
    ラビットホールDECO*2723/05/192年と140日
    テトリス柊マグネタイト24/11/081年と38日
    KINGKanaria20/08/025年と403日
    モニタリングDECO*2724/11/221年と53日
    きゅうくらりんいよわ21/08/294年と220日
    オーバーライド吉田夜世23/11/292年と174日
    *1 所要日数は閏年を考慮していない。
    参考:初音ミクWiki

    2020年以降に公開したものが12曲中9曲を占めており、中でも目を引くのが「メズマライザー」の204日という記録だろう。

    これらの楽曲はいずれも一億再生は2020年になってからであり、ボーカロイドという文化が世界的に十分に浸透した結果であるとも言えるだろう。

    さらに、The VOCALOID Collection(ボカコレ)が2020年からスタートした。

    リズムゲームとしてプロジェクトセカイ カラフルステージ! feat. 初音ミクも2020年にリリースされたゲームである。

    様々な因子が重なり、ここまでの拡大を起こしたと言えだろう。

    また、「ボカロを聞いて育った」層が大人へとなっていることも影響を与えているように感じる。

    曲の多様化へ

    2007年のメルトショックののち、初音ミクはキャラクターの枠組みを超えて歌い手へになった。

    今現在のボカロはロック、ポップス、エレクトリック、Lo-Fi的楽曲と様々なジャンルの音楽を内包したものと言えるだろう。(それらが「合成音声」という枠組みで一つのジャンルを形成しているのはなんとも不思議でならない。)

    さらに、重音テト(synthesizerV)など、「ヤマハのVOCALOID」ではないボカロが増えている。

    これらは合成音声が機械学習やAIなどの最新技術によってさらに高いレベルに達したといえるだろう。

    まとめ

    ボカロという文化は世界的に盛り上がりを見せている。それらは技術の向上や世界的な広がりが要因として挙げることができる。歴史が積みあがってきた結果、再燃したといえ、当時砂の惑星を出したハチもこうなることを願い、あの曲を出したのかもしれない。

    編集後記

    この記事を書いている間にメズマライザーも2億再生を突破した。ボカロが音楽としての地位を確立しているように感じるし、これからもさらなる広がりを見せることを心から期待している。

  • widevineとはどんな技術か

    さて、今回のテーマはWidevineについてである。

    サブスクリプションを契約し配信で映画を見るのが当たり前となった昨今でなくてはならない技術、それが「Widevine(ワイドバイン)」である。

    Widevineのロゴ

    この技術はNetflixなど著作権で保護された動画を再生するサービスで使われている。

    さて、今回はこの技術の解説をしようと思う。

    なぜ保護が必要なのか

    まず、配信サイトで見るのになぜこのような技術がいるのかという話から入ろう。

    前までは映画を見るのは映画館でしか見れなかった。その後、アナログテレビやVHSなどが開発され、家でも映像を楽しむことができるようになった。

    その後、テレビのデジタル化によりより高画質で映像を楽しむことができるようになった。しかし、それによりコピーガードの重要性は高まることとなった。

    テレビにはダビング10やコピーワンスによってコピー回数を制限しているし、HDMIなどにもHDCPと呼ばれる保護システムがある。(これらに関しても今度記事を書くかもしれない)

    なお、これらは総じてDRM(デジタル著作権管理)と呼ばれることもある。

    さて、スマホの進化により手のひらサイズの端末で映画を見れるようになった。そして、これらの端末で再生する時に保護する技術が必要であった。

    その技術が今回の話のテーマである、Widevineである。

    どんなサービスで使われているか

    Widevine公式サイトより引用 これらは一例である

    上記の画像を見てもらったらわかると思うが非常に多くのサービスで使用されている。

    各種配信プラットフォームに加え、SamsungやNvidia、Playstationなどのデバイスを製造している企業においてもWidevineを使用していると記載されている。

    これは次章で説明するが、Widevineがデバイスと紐づいた技術であるからである。

    ちなみにここにiPhoneなどがない理由はAppleは独自の技術(FairPlay)を使用しているからである。

    どのようにして保護するのか

    Widevineは3つのレベルを決めている。L1,L2,L3という段階が存在し、数字が低い方が保護システムが強固で、より高画質の動画を見ることができる。

    それぞれについて技術的な解説も含めて詳しく話そう。

    最も強固で高画質なL1

    L1は最も高画質で動画を見ることができる。これはハードウェアの専用領域(TEE)で処理するためである。

    意外とこのような領域を設計している端末が多く、他の使用例であればiPhoneの顔認証や指紋認証にも専用領域を使うことで生体情報の抜き取りを防いでいる(実際、アプリ側では認証が成功したか失敗したかのみ知ることができ、生体情報にはアクセスできない。)

    FaceIDのロゴ
    さらに詳細な技術的解説

    まず、WidevineはCPUがメインOSですらアクセス不能なレベルの暗号化された領域である、(Trusted Execution Environment:TEE)に対応しているかを確認し、その領域内でコンテンツの復号化および処理ができることを確認する。
    そして実際に映像を再生する際はTEE内部で全て処理されるのでキャプチャなどで映像を抜き取ることができないようになっている
    TEEは複数の企業が技術的実装をしている
    (例:Arm:TrustZone,Intel:SGX/TDX,AMD:SEV-SNP)
    がどれも根幹は同じでCPUの処理部分とRAMに暗号化された安全な領域を作成し、その内部で機密情報を処理する。

    これらの領域で処理することでキャプチャされることを防ぎ、高画質で映像を提供できる。

    なお、どれぐらいの画質で処理するかはサービスの実装で異なる。(ほとんどの場合、L1はHD以上の画質で再生できる。) 参考:netflixでHD以上の再生ができる端末一覧

    補足だが、L1に対応していた端末でも脆弱性の発見などでライセンスが剥奪されることがある。

    部分的な対応であるL2

    L2はTEEがあるにもかかわらず、処理はTEEを使用せずにソフトウェア(もしくはTEEでないハードウェアエンコーダ)で行われる場合になる。

    L2に関してほとんど目にすることはない(Widevineの実装初期に一部端末で使われた設定で、筆者も見たことない。)

    最低設定だけどほとんどの端末で再生できるL3

    さて、L3はほとんどの配信サイトで画質が制限されているがこれはTEEが存在せずソフトウェアで全てを処理するためである。

    しかし、ほとんどの端末で再生できる(Google ChromeやFireFoxなどのブラウザ側で実装できるためである)

    ちなみにnetflixのブラウザ別画質はこちらから確認することができる

    もうちょい踏み込んだ解説

    GoogleChromeなどのブラウザを使用した場合でもTEEが存在しOSが対応しているとL1が使える。ちなみにFirefoxはそのポリシーからプロプライエタリなプログラムを含むことができないが、拡張機能で対応している
    また、MacのSafariではFairPlayを使用するが、そもそもFairPlayはネイティブ動作を使用する前提なので最高画質で再生できる。
    同様にWindowsではPlayReadyを使用していて、EdgeではWidevineではなくPlayReadyによって処理されTEEの有無で画質が変わる。

    タブレットを購入する際に注意

    さて、対応サービスにハードウェアベンダーが含まれるのは、それらのチップやOSレベルでの実装をしなければ4Kを含む高画質で視聴できないからである。

    PS5は4Kに対応していて、尚且つnetflixなどの配信においても4Kで見ることができるのはSonyがそのための実装を行なっているからである。

    Amazonなどに売っている中華タブレットによくあるのだがこれらに対応していないとカスみたいな画質で見ることになる。最も、最近のタブレットは対応していることが多いし、Androidの場合はSoC(チップのこと。Snapdragonなど。)から対応していることがあるのでよほど怪しい物でもなければ引っかからないだろう。

    まとめ

    Widevineについて解説した。多少は噛み砕いて技術的解説を行なったが、このようなかげで動く重要な技術について興味が湧けば幸いである。

  • 別観点からDLSS 5を批判する

    先日NVIDIAの開発する「DLSS」の最新バージョンが発表された。

    バイオハザード レクイエムでの実装例

    さて、この手の話題に詳しい方ならもうすでに分かっていると思うが、絶賛炎上中だ。

    具体的にはゲームに「AIフィルター」をかけるのはコンテンツクリエイターや、CGクリエイターに対する冒涜であるというものだ。

    これに対してNVIDIAのCEOは「コンテンツクリエイターが自由にコントロールできるものである」として反論した。

    まあここまでの流れは皆さんも理解していると思うが、私としてはこれまでの批判に加え、別の観点からこの技術を批判したい。

    それは

    明確なビジュアルの変更を含む技術を自社GPUのみで使用するのは表現の幅を狭め、ゲーム産業を破壊する

    ということだ。

    まず、DLSSはNVIDIAのGPUでしか使えない。そのうえで、「レンダリング」という極めてビジュアルに大きく関係する箇所にこの技術を使用するのは今後のゲーム開発に重大な影響を及ぼしかねないと思う。

    DLSSが出てからどうだろうか。AIによるフレーム生成により最終的なFPSは増加した。しかし実際には半分のFPSしか出ておらず、DLSSに頼り最適化を怠るのではないかという懸念がある。

    実際に特定のゲーム(名指しするならモンハンワイルズ)で最適化が圧倒的不足している事象があるだろう。

    さらに、RadeonやIntel Arcでこれらの機能が使えないことも大きな問題点だ。

    Steamハードウェア&ソフトウェア 調査によれば、現時点でのNvidiaGPUの使用率は73%であった。(今月は84%であったが中国の春節の影響が多くみられるため先月の割合を参考とする。毎年この時期はNvidiaGPUのシェアが高くなるとともに中国語のユーザーが以上に高くなる)

    Steamハードウェア&ソフトウェア 調査: February 2026より

    この技術は27%のゲームユーザーに対し劣化したグラフィックを提供することを意味する。

    フレーム生成に至ってはFSRで実装できたものの、このようなゲームの中核に自社技術のAIを用いるのはNVIDIA以外のGPUを使っているユーザーをないがしろにしている。

    実際にはこの技術を使うかどうかは自由である。しかしDLSSがもたらした最適化不足を見たものとして「これ前提」で作るのはゲーム制作の技術を後退させるだけでなく、市場の公平性からみても危険であると言わざるを得ない。

    さて、とどのつまり

    クリエイターがこの機能を積極的に使用するのは危険である

    ということだ。「革新的なグラフィックを提供できるよ(NVIDIA専用でね!)」なんて言っているNIVIDAには強い懸念と疑念を抱かざるを得ない。

    これで本当に革新的だと思っているのなら自惚れも大概にしてほしいものである

    実際この機能の行きつく先はどうなるのだろうか。今後の動きも注視したい。

    さて、今日はこのへんで。

  • 超かぐや姫の感想(気になった所も)

    超かぐや姫!公式サイトより

    最近大ヒットして世間を賑わせている「超かぐや姫!」。筆者は初日のチケット(サツゲキのチケット)を残り1席でギリギリ取れたので観に行った

    予約したチケットをとってエントランスに入ると30分以上前に着いたというのにたくさんの人で賑わっていた。歩行者天国の一角にありそこまで大きくない映画館なので、よくわからない非常階段のようなスペースに人が続いていく形で待機していた。

    入場者特典も無事にもらえた

    さて、前置きが長くなったが映画の感想、良かった点、気になった点について述べたいと思う。
    ただし、この感想は個人的に思った点を述べているのであって、それ以外の他意がないことを理解してほしい。

    また、まだ映画を観ていなくてこれから観る予定がある方はぜひ観てほしい。おすすめできる映画である。

    ネタバレを含むので注意

    見終わった時の感想

    普通に面白い。2時間20分とそこそこの長さがあったのだが見てる間はほぼ時間を気にせずに見ることができた。密度が高いので飽きることなく最後まで見れた。

    軽く感想を述べたところでここからは具体的な評価に移りたい。

    良かった点

    まず見てて一番に思ったところ。

    背景とキャラクターの一体感がすごい

    近年のアニメは背景をCGで描画しキャラクターの部分をアニメーションで描画しているものが多くある。昔「君の名は。」を見た時に背景の精巧さに目を奪われたものである。

    この映画はその段階から一段登って「完全な一体感」が生まれている。ライブシーンや、アクションシーンなど3Dを2Dに落とし込むと同時に、キャラがいるところではそちらに目線を誘導することで一切「次元のずれ」が気にならない。

    ここまで違和感なく3Dを2Dに落とし込めるものかと見ながら感動していた。

    「かぐや姫」という物語のアレンジ

    この映画の公式サイトのTOPにも書いてあるとおり「日本最古の物語」である「かぐや姫(竹取物語)」を現代にアレンジしてる。

    かぐや姫が月に帰る様子を描いたもの WikimediaCommonsより

    ベースとなる物語があることで「ひょんなことから出会って」「最後に別れなきゃいけない」けど「それに抗う」話ということがわかりやすいし、補足がなくても理解しやすい。

    だからまだ映画に入りきってない段階で発生する「出会い」のアクションをすんなり入れることができるし、各段階のアクションの理由を明確に説明しなくても「竹取物語」で説明できる

    密度が高い

    これは人によって評価が分かれるかもしれない。特に途中のパートは大幅にタイムラプスされていた。個人的にはスピード感を持たせてちょうどいい塩梅に感じたが、これは人によるのかもしれない。

    ただ、この密度の弊害というのも感じたところがあったのでそれは気になった点で話したいと思う。

    気になった点

    ここからは気になった点を書こうと思う。いくつか挙げさせてもらいたい。

    ライブシーン

    世間的には評価が高いライブシーンだが個人的にはイマイチに感じた。
    ライブシーン自体の完成度は素晴らしかったし、ボカロを愛する人間としてボカロから生まれた曲がこうして映像と合わせて世界に広まるのは素晴らしく思う。

    「ワールドイズマイン CPK! Remix」ライブシーン 公式Youtubeチャンネルより

    では、何が問題なのか。それは「前段階での理由付けが不十分」であるように感じたからである。
    良い点で挙げた「竹取物語での理由付け」は一切できないし、「密度が高い」ことによって「なぜライブなのか」ということが一切わからなかった。Vtuber文化であるのかもしれないが、筆者はそういったものには疎く、ライブシーン中も気になってしまった。

    主人公が作曲能力があるという設定の上での話なのかもしれないが多才であるためにむしろ他のもので良いだろうという気持ちが強まってしまう。ゲームシーンで共闘してたのもあってかなり感動が薄まってしまった。

    母親の中途半端感

    主人公の母親は厳格な人でそれゆえに主人公が努力しているきっかけとなっている…と思ったのだが最後の方に向かうにつれ「結局普通の母親なのか?」という疑問が浮かんできてしまった。結局やりたいことをやらせてあげるし、最後までやり遂げろということを言っていたが、決して母親が押し付けているわけではないような感じでもあった。

    これが小説のような1人称視点なら主人公から見た母親の変化ということで良いのだが映画という3人称視点から見るならばもう少し序盤から母親のフォローが欲しかったように感じる。乗り越えるべきハードルとして見せるのであればもう少し深掘りして欲しかった。

    まとめ

    色々書いたがこの映画は最初に話した通り「おすすめできる映画」である。全体通してハッピエンドの形で終わらせているし、関係の構築と変化を楽しみ感動する話である。

    百合的要素に関しても個人的にそこまでのものではなかったように感じる。友情的関係の上で成り立つ百合といった感じで「リコリス・リコイル」の千束とたきなのような関係構築であった。

    ぜひ皆さんも機会があれば観てみてほしい。私はこの映画を観てこれからのアニメーション表現がどのように変化するか、できるかをより一層注視したいと思った。

  • LFM2.5を使ってみよう

    LFM2.5について

    みなさんは「LFM2.5」をご存知だろうか。これはAIモデルで、特に1.2Bという極めて軽量なモデルである。

    公式サイト
    https://www.liquid.ai/blog/introducing-lfm2-5-the-next-generation-of-on-device-ai

    1.2Bがどのぐらい軽いかというと、現代のコンピュータであればノートPCでも問題なく動作でき、スマートフォンなどでも動作するレベルの軽量性である。

    なおこのLFM2.5が公開されたのは1月5日であり、最先端の軽量AIモデルである。

    公式サイトより

    上の画像はAMDのRyzenとSamsungのGalaxy S25 Ultraで他のAIモデルと比較したグラフである。

    ここでの単位は「トークン毎秒」で数値が高い方が出力が速いということだ。その他のAIモデルと比べて速いのがわかるだろう。

    また、あくまで体感だがGPT3.5と比べても同じ精度で出力することができている。むしろこっちの方がやや正確かもしれない。

    LFM2.5を使用して「あなたを使ってできること」を聞いた

    この画像は完全にローカル環境で実行した画像だ。写っているのは一部分でもう少し長く出力された。

    生成終了までかかった時間は40秒ほど。実行環境はiMac late 2015(i5 5250U,8GB,オンボードGPU)だ。10年前の事務用PCである。しかも後ろで通話とネットサーフィンをしながら実行している。

    いかにこのモデルが軽量であるかわかると思う。


    インストール方法

    さて、インストール方法を解説しよう。ただ、軽量のAIモデルとは言っても最低限の性能は必要だ。とはいえ、相当前のPCでなければ問題ないだろうと思う。Windows11が入っているようなPCであれば問題ないだろう。

    まずは、LLMフレームワークが必要だ。筆者はOllamaを使っているのでその方法で進めよう。

    まずOllama公式サイトにアクセスし、自身の使用しているOSに合わせてダウンロードする。

    現在はWindowsでもGUIで使えるようだ。(古いバージョンではCUIのみだった)

    インストールが終わったらWindowsならコマンドプロンプト、Macならターミナルを起動する。コンソールウィンドウを開いたら

    ollama run hf.co/LiquidAI/LFM2.5-1.2B-Instruct-GGUF:Q4_K_M

    と入れよう

    なおこれはOllamaを使う場合でその他のフレームワークを使う場合は

    https://huggingface.co/LiquidAI/LFM2.5-1.2B-Instruct-GGUFへアクセスして「Use this model」を選択、各フレームワークの指示に従ってほしい。

    その後使用するモデルをLLM2.5に設定、「こんにちは」と入れてみよう。

    モデル選択

    どうだろうか。うまく動いただろうか。

    PCによっては読むのが追いつかないほどの速度で生成されるだろう。ぜひいろいろと試してみてほしい。


    なお余談だが、このLFM2.5は日本語特化モデル視覚言語モデル音声言語モデルもある。今回紹介したのは汎用モデルのinstructだがこれらのモデルも試してみると面白いかもしれない。

    ということで今回は軽量AIモデル、「LLM2.5」を紹介した。

    ではまた今度。