欅樹雑記: 2024

2024年9月29日日曜日

Reactアプリケーションが驚きの白さになる問題（net::ERR_CONTENT_LENGTH_MISMATCH）

Reactを使っていて、なぜか画面が真っ白になることがありました。驚きの白さです。

ブラウザーの開発者ツールでネットワークをモニターしたところ、CSSやJSなどの静的ファイルの読み込みに失敗していることがわかりました。

JSの読み込みに失敗したら驚きの白さになるというのはまあごもっともなんですが、問題は読み込みに失敗している原因がわからないこと。なにしろ、ローカルや開発環境では全く問題ないのに本番環境だけで問題が発生しています。そして読み込みに失敗している原因がnet::ERR_CONTENT_LENGTH_MISMATCHです。なんじゃこら。

色々原因を探っていたら、最終的に見つかったのがコンテンツ配信サーバーのディスクフル。

配信サーバーのストレージが足りない→コンテンツのキャッシュができない→誤ったデータを返す（？）みたいな流れで起きるピタゴラスイッチのようです。

ディスクフルくらい監視して気づけや、というツッコミは勘弁してください。今回は色々事情があったんです。。。

2024年9月22日日曜日

Docker使っててストレージを圧迫してるやつはこれ実行しろ

まじで実行しろ。びっくりするくらい空き容量できるから。

docker system prune

2024年9月15日日曜日

zedの公式Gentooパッケージが出た

以前紹介したエディターのZedについて。

なんとかGentooでネイティブビルドするパッケージを作ろうとCargoのebuildパッケージ作成に挑戦していました。どうもうまくいかずモタモタしている間になんとGentooの公式からパッケージが登場しました！

https://packages.gentoo.org/packages/app-editors/zed

amdキーワードがマスクされているので、ACCEPT_KEYWORDSを設定しておいてください。

あと環境によってはファイルオープンダイアログが表示されないことがあります。そのときはxdg-desktop-portalをインストールして再ログインしてください。

使ってみましたが、やっぱり爆速ですね。後発であり、おそらくまだベータ版扱いだと思うので機能面ではさすがにVSCodeには劣りますが、簡単なコード編集には充分です。

応援の意味も込めてガンガン使ってます。みなさんもどんどん使ってください。MacとLinuxに対応しています。もうすぐWindows版も出るそうです。

2024年9月8日日曜日

サーバーにDockerをインストールするときの約束

いいかい学生さん、Dockerをな、DockerをLinuxサーバーにインストールするときはな、一般ユーザーをdockerグループに追加するんだよ。

それが、root権限を使い過ぎもしない、ちょうどいいくらいってとこなんだ。

usermod -aG docker user

2024年9月1日日曜日

DockerfileでARGを1行に複数指定できた

すでに知っている人にとっては何を今更と思うかもしれませんが、つい最近知りました。

公式のリファレンスの書式では1つしか指定できないように見えます。

ARG <name>[=<default value>]

使用例も1行に1つずつ指定する方法しか書いてありません。

FROM busybox
ARG user1
ARG buildno
# ...

でも試してみた結果、以下のように1行に複数のARGを指定できました。

ARG foo bar

ちなみにENVはちゃんと1行に複数指定できることが明示されています。

これで少しでもDockerイメージのレイヤーを減らせれば。。。

2024年8月25日日曜日

返信率が低いスカウトメール

時々、知り合いの会社（複数）の人事の方から「エンジニア（IT開発者）にスカウトメールを送っているけど返信率が低い」という相談を受けることがあります。

話を聞いていると大体以下のどれかに当てはまっていることが多いのですが、他に思い当たる方はいないでしょうか。

2024年8月18日日曜日

GoのDTLSライブラリーの不具合

GoでPion DTLSというライブラリーがあります。これはUDPの暗号化通信をするときに使われるライブラリーなので、特殊なプロトコルの実装以外ではそもそもそういうソフトウェアを開発する機会自体があまりないかもしれません。

このライブラリーにちょっとした不具合がありまして、コネクション切断後の再ハンドシェイクがDTLSの仕様どおりの挙動をしていないようです。

具体的には明示的なコネクション切断を行わずに同じ接続元（アドレス:ポート）からClientHello受け取ったとき、DLTSの仕様ではサーバーは新しいハンドシェイクを開始するべきなのですがこのライブラリーではClientHelloが無視されます。

1年近く前にその問題を報告したのですが、つい最近この問題が解消されたようです。

かなりニッチな情報ですが、個人的に結構嬉しかったのでここで報告。。。

2024年8月11日日曜日

Fluentdでmultilineを使うときにちょっとだけ注意

前回に引き続きFluentdの話。今回はmultilineパーサーについてです。

このパーサーは正規表現で複数行を解析できるので、regexpの上位互換みたいなもんか。じゃあ何も考えずmultilineにしとけばええやん！と思っていたら・・・

なぜか最後の行が出力されない。

これでしばらく悩んだんですが、そもそも考えてみたら次の行頭が確定するまで現在の行全体が確定しないわけですからそりゃそうですね。

というわけで、しばらく入力がなかったら自動的に行を確定させるためにmultiline_flush_intervalを設定しましょう。

これも数日ハマったので、同じようなハマり方をしている人のために残しておきます。

2024年8月4日日曜日

FluentdでS3に出力するときに気をつけること

クラウド全盛期の今、ロギングツールも各クラウドの機能に取って代わられている感がありますが、まだまだ現役なFluentdの話です。

Fluentdで収集したログをAWS S3にアップロードする場合、セキュリティー対策として（アカウントが乗っ取られたときにログを盗まれないように）アクセスキーやロールにWRITE権限しかつけないことがあります。

そのときは、out_s3プラグインの設定で以下の項目を無効にしましょう。

  auto_create_bucket false
  check_bucket false
  check_object false

よく考えれば当たり前なのですが、諸々の存在チェックはS3側に読みに行くので、READ権限が必要です。これらを無効にしておかないと、エラーが出てログを収集できなくなります。

なんでこんな当たり前のことをわざわざ記事にするかというと、これを忘れてハマったからです。

2024年7月28日日曜日

UNICODEのHELLO WORLD

5人組アイドル「UNICODE」登場　デビューシングルは「HELLO WORLD」　IT関心層「検索しにくそう」

はい。ただのネタです。

そもそも文字コードとしての「ユニコード」は“Unicode”（先頭のみ大文字）、K&Rの元祖「ハローワールド」は“hello, world”（全て小文字、カンマあり）なので、このアイドルのことを知らなくてもブログのタイトルを見た時点で「ITとは関係ないな」とわかるはずです（？）

よーしパパ X5O!P%@AP[4\PZX54(P^)7CC)7}$EICAR-STANDARD-ANTIVIRUS-TEST-FILE!$H+H* というユニットを作っちゃうぞー

ユニット名を保存したファイルがセキュリティーソフトに引っかかってもしらないぞー

詳細はEICARテストファイルで。

2024年7月21日日曜日

スクラッチから開発する新しいブラウザー Ladybird

Google広告費の影響を受けない新たなWebブラウザが必要だと、スクラッチからWebブラウザを開発する「Ladybird Browser Initiative」、元GitHub創業者らが立ち上げ

動機は納得だし、健全な競争のためにも大いに応援したいと思っています。ただここまで巨大化したウェブ標準をフルスクラッチで実装するのは骨が折れるどころか粉末状に砕けるレベルの大仕事でしょうね・・・

当面の問題は、開発人材の確保と運営資金でしょうか。

とりあえずリンクをぺたり。みなさんも応援してあげてください。

公式サイト

GitHubリポジトリー

2024年7月14日日曜日

命名的問題 vs 構造的問題

技術的負債を抱えたレガシーコード。変なメソッド名と入り組んだロジック、リファクタリングするならどちらが先？（前編）

技術的負債を抱えたレガシーコード。変なメソッド名と入り組んだロジック、リファクタリングするならどちらが先？（後編）

記事の内容は「メソッドの名前がおかしいが実装わかりやすいコード」と「メソッドの名前は問題ないが実装がややこしいコード」の2つを50人ほどのJavaプログラマーに解読してもらい、メソッド名と実装のどちらを先に修正すべきかというものです。

統計結果を見る前に思ったのは、メソッド名を先に直すべきではないかということ。理由は記事中にある

構造的問題は局所的に起こるが、命名的問題はコードのどこにでも出てくるものがあるため

「命名的問題」があるとコードが信じられなくなる

などです。そして上記記事でも「命名が不適切なコードの方が読解精度が低い」という結果が出ました。

また実際の開発現場でも、命名が不適切なコードの方が読解精度が低い」という結果ですが、コードリーティングの際に実装がややこしい場合は「何だこれ？」と思って注意して読み進めるのに対し、命名が不適切な場合はメソッドの役割を勘違いしたまま開発を進めてしまう可能性があるので命名的問題のほうが深刻だと考えています。

2024年7月7日日曜日

JANOG54 Meetingに参加しました

先日7/3-5に、奈良でJANOG54 Meetingが開催されました。毎回ネットワーク分野の錚々たる企業が集まっており、日本国内でインターネットが壊れた場合は大抵ここの参加企業のどこかが何かやらかしていると考えて間違いないです。

色々ブースを見て回った他、さくらインターネットのブースで「高火力 DOK」の説明も行いました。AI関連のサービスなのでネットワークと直接関係はないんですが、6/27に発表されて1週間ほどしか経っていないサービスなので、広報も兼ねて説明要員としても参加しました。

サービスインしたので晴れてプロフィール更新

このサービスの開発マネージャーをしています

なお開発マネージャーの仕事は、やることをメンバーにぶん投げてケツ叩いてあたかも自分の功績かのように見せることですhttps://t.co/nleAbVGDkk
— おだしま@手品をするITエンジニア (@shimataro999) June 27, 2024

ネットワークなどの低レイヤーにあまり興味のないウェブ開発者もいると思いますが、自分たちが開発している（あるいは普段使っている）サービスの土台を知るためにもこういうカンファレンスはおすすめです。最初は言っていることがさっぱりわからないかもしれませんが、何度も参加しているうちに知り合いができたり話の内容も理解できたりするので面白いですよ。

奈良には学生時代に数年（今回の会場から2駅ほどしか離れていない場所に）いたんですが、さすがに当時から時間が経っているので駅前がかなり開発されていますね。ただ夏暑く冬寒いという気候は相変わらずでしたが。

2024年6月30日日曜日

excuse us

やや混み気味の電車に乗っていたとき、外国人の家族連れが降りようとしていました。そのときに聞いたのが “Excuse us”

こういうときのイディオムは “Excuse me” が定番だと思っていましたが、usは初めて聞きました。

よく考えれば、許してもらう対象が家族という「複数」の場合はusを使う、というのは当たり前といえば当たり前ですね。知っている人にとっては「何を今更」という感じでしょうが、今まで習ったことも聞いたこともない表現だったので勉強になりました。

　　 ／⌒ヽ 
　　/　´_ゝ`）　　 ／⌒ヽ 　Excuse us...
　　|　 　　/ 　　/　´_ゝ`） 
　　| /|　|　　　　|　 　　/
　 //　| | 　　　　| /|　|
　Ｕ　 .Ｕ　　 　 //　| |
　　　　　　　　 Ｕ　 .Ｕ

2024年6月23日日曜日

ひも理論から円周率の公式を発見

インドの物理学者がひも理論の研究から偶然「円周率」の新しい公式を発見

いやー、こういう発見があるから数学は面白い。数学が「自然科学の言語」と言われるのも納得です。

原論文はこちら。実際の計算公式は以下のとおりです。

\begin{eqnarray*} \pi=4+\sum_{n=1}^{\infty}\frac{1}{n!}\left(\frac{1}{n+\lambda} - \frac{4}{2n+1}\right)\left(\frac{(2n+1)^{2}}{4(n+\lambda)}-n\right)_{n-1} \end{eqnarray*}

2つほど補足すると、唐突に出てくる$\lambda$は実部が$-1$より大きな任意の複素数、右下の小さな${}_{n-1}$はポッホハマー記号（昇冪）です。

Pythonで書くとこんな感じ。元の式をできるだけ忠実に表しているので、メモ化などの最適化はしていません。

# https://gigazine.net/news/20240619-string-theory-pi/
# 原論文: https://journals.aps.org/prl/pdf/10.1103/PhysRevLett.132.221601
import math

def poch(x: float, n: int) -> float:
    # ポッホハマー記号（昇冪）
    # https://ja.wikipedia.org/wiki/%E3%83%9D%E3%83%83%E3%83%9B%E3%83%8F%E3%83%9E%E3%83%BC%E8%A8%98%E5%8F%B7
    y = 1
    for j in range(n):
        y *= x + j

    return y

def term(lambda_: float, n: int) -> float:
    # 第n項を計算
    a = 1/(n+lambda_) - 4/(2*n+1)
    b = (2*n+1)**2 / (4*(n + lambda_)) - n
    return a * poch(b, n-1) / math.factorial(n)

def pi(lambda_: float, n: int) -> float:
    # 円周率を計算
    p = 4
    for n_ in range(1, n):
        p += term(lambda_, n_)

    return p

print(pi(1000, 100))

Python Praygroundにコードを貼り付けると結果が出てきます。pi関数に渡す値を色々いじって遊んでみてください。

2024年6月16日日曜日

𝕏の「いいね！」非公開

X、「いいね！」を週内に非公開化すると発表

わざわざこの記事を取り上げた理由はこの記事そのものではなく、これに対するGoogle翻訳。

"Like"（名詞）を「いいね！」
"like"（動詞）を「『いいね！』する」

のように、ちゃんと文脈を捉えて訳しているのが興味深かったです。

𝕏関連の文章も大量に学習させたんでしょうけど、過学習起こしてないよな・・・？

2024年6月9日日曜日

Enpassのバグその後

先日、FirefoxのプライベートモードでEnpass拡張機能が動作しなくなったという記事を書きました。記事中にあるとおり公式フォーラムでも報告したんですが、「プライベート拡張機能を有効にする設定にしてね」というコメントをいただき、ちょっと話が噛み合っていませんでした。

そして最近Firefoxを更新したところ、拡張機能が使えるようになっていました。何もしてないのに壊れて何もしてないのに直りました。

Firefox本体の仕様の問題だったんでしょうか。でも全ての拡張機能が使えなくなっていたわけでないので詳しいことはよくわかっていません。モヤモヤ感は残りますが、とりあえずフォーラムにも報告して一件落着（？）です。

2024年6月2日日曜日

パスワードの定期変更について

総務省のサイバーセキュリティ https://t.co/o01Iy1ems9 パスワード管理ツールを推奨、パスワードの定期的な変更は不要と断言、すばらしい pic.twitter.com/a7FsA7Xh4z
— Haruhiko Okumura (@h_okumura) May 25, 2024

昔、アルゴリズム辞典やLaTeXの本などで大変お世話になった奥村先生のポストより。

このポストについては何も異論はないのですが、とはいえこのブログで何度か取り上げたように「パスワードは半角英数16文字以内」のようにお前絶対ハッシュ化しとらんやろというウェブサービスがいまだ存在しています。

そういうサービスがSQLインジェクションのような基本的な攻撃に正しく対応しているところばかりとも思えないので、「いつかデータを引っこ抜かれることを想定した定期的なパスワード変更」は必ずしも無意味ではないと思います。

何事も臨機応変に。

2024年5月26日日曜日

プログラミング言語の省略表記について

ちょっと前にPythonを滅ぼそうやない会とかいう記事が投稿され、それに対するアンサー記事も投稿されるなどまあまあ賛否両論だった記憶があります。

個人的にはシンタックス云々に一部同意する部分もありつつ、でも英語の語順的にまあそうだろうなーというアンサー記事に同意する部分もありつつ、でも英語話者以外が使うことも考えてくれよなーと思いつつというどっちつかずの状態です。

個人的ついでに書くと、三項演算子やラムダ式などの省略記法は基本的に書きません。リストの内包表記も使いません。理由はあとで自分がすんなり読める自信がないから。

「そんなもんも読めないお前のスキルが低いだけ」と言われたら返す言葉もないんですが、とはいえ大抵のプログラマーは数ヶ月前、いや数週間前に書いた自分のコードが理解できないという状況を経験しているはずで、なるべく平凡な書き方のほうが大抵の人が理解しやすいでしょう。

Pythonに限らず、他の言語でもあまり省略記法やシンタックスシュガーは使わない傾向ですね。例えばJavaScriptのオプショナルチェーンとかも使いません。

JavaScriptといえば、個人的には互換性を数十年引きずっているあの言語仕様はなんとかならんもんかと思ってます。とはいえ上澄みをすくおうと頑張っているAltJSが生まれては消え、スーパーセットを謳っているTypeScriptが事実上のデファクトスタンダードという現状を見ると、これが市場の意思なんだと納得するしかないですね。JSConfの運営ボランティアにも入っていながらこんなこと言うのもアレなんですが。

結局何を言いたいのかよくわからん記事になってしまいましたが、要するに自分は平凡なソースコードを書いてるよという極めて平凡な内容しか書いてないですね。

2024年5月19日日曜日

ReLU関数がよくわからない

ニューラルネットワークの活性化関数にReLUってあるじゃないですか。あれがどうもよくわからんのです。

数学的な定義とか「正の値の微分が1なので勾配消失問題に強い」とかは知ってるんですけど、なぜこれを使うと精度が向上するのか、負の値を一律で0にすることがニューラルネットワーク上でどういう意味を持つのかがわかりません。

上でリンクを張ったWikipediaでは

2000年にHahnloseらによって強い生物学的動機と数学的正当化を持って、動的ネットワークへに導入された

とありますが、生物学的な動機ってなんだろう。。。

そしてPyTorchのseq2seqとAttentionのチュートリアルでは、デコーダーの単語埋め込み（ベクトル表現）に対してReLUを適用していますが、これって大丈夫なん？

ベクトル表現の負の値を0にしてしまうと別の単語が同じ表現になってしまったり、特に全ての要素が負の値で表現される単語があったら、ゼロベクトル（PADやUNKなどの特別な単語）として扱われたりするんじゃないかと。

まあ内部状態は刻々と変化するのでゼロベクトルが渡されたからといって毎回出力結果が同じになるわけじゃないですし、そうなることを織り込み済みで学習させているので問題ないという理屈なんでしょうか。

誰か詳しい人教えてください。生物学的動機についても。

2024年5月12日日曜日

プロジェクトを成功させる人

𝕏で、時々勝手に引用ポスト（大抵は大喜利みたいなネタ）させてもらっているアカウントがいくつかあります。

その中の1つのアカウントで、こんなポストがありました。

｢プロジェクトを成功させる人とは？｣と聞かれたら｢試行錯誤にくじけない人｣だと答えたい。PDCAを回すには、自己否定の数がモノを言う。自分で決めたプランの欠点を分析するのは正直しんどい。でも逃げたらダメ。｢失敗は成功のもと｣その言葉の裏にあるのは、何度心折れても投げ出さない強さだ
— 雪@言語化する広報 (@yuki8marketer) May 10, 2024

自分だったらこういう質問に対してどう返すかな？というのが今回のテーマです。

2024年5月5日日曜日

zedのGentoo対応

先日zedの記事を書きましたが、早速Gentoo用のebuildファイルの作成に取り掛かっています。

このへんを見るとtomlファイルから自動的にebuildを作るスクリプトもあるようですが、どうも依存パッケージの解決まわりがうまくいかず作業が止まっています。Rustなにもわからない。

とりあえず一旦ebuildファイルの作成は休憩して、Linux向けの依存パッケージインストールスクリプトをGentoo対応するPullRequestを出してみました。サクッとマージされてv0.134.1-preで導入されたようです。

これで、このドキュメントに沿ってGentooでビルドできるようになったはずです。ちなみに依存パッケージインストールスクリプトを実行するにはrustupも必要ですが、これはデフォルトではインストールできないのでキーワード指定する必要があります。

v0.134.1-preからLinux用のバイナリーも同梱されているようなので、どうにもならなければバイナリーをインストールするebuildを作ればいいのですが、せっかくのGentooなのでソースコードからビルドするebuildにチャレンジしています。あるいは誰かRustに強い人手を貸してください。

2024年4月28日日曜日

MS-DOS 4.0がオープンソース化

タイトル通り、MS-DOS 4.0がオープンソース化されたそうです。ライセンスはMIT。

https://github.com/microsoft/MS-DOS

記事にも書いてありますが、10年前の2014年にはMS-DOS 1.1と2.0、そしてWord 1.1のソースコードが公開されており、今回はそれに続く公開です。

現在MS-DOSと同等の環境がほしいならFreeDOSがあるので技術的な価値はほぼゼロでしょうが、歴史資料としての価値はとても大きい（気がします）。

そのうちWindowsの旧バージョン（NTより前）とかもオープンソースになるんでしょうか。まあこれも技術的には不完全とはいえReactOSがあるんですが。

2024年4月21日日曜日

新しいテキストエディタ Zed

新しいテキストエディタの存在を知りました。

Discordのようなマルチプラットフォームデスクトップアプリを開発するために使われるElectron.jsや、Visual Codeの登場以前で最も優れたテキストエディタの一つとされたAtomエディタの開発者たちが、これまでにない先端的なテキストエディタ「Zed」の開発に取り組んでいます。… pic.twitter.com/K461B9jmeU
— Jeffry Alvarado (@jalva_dev) April 20, 2024

このポストやウェブサイトを見た感じの事前情報としてはこんな感じでしょうか。

VSCodeのようなソースコードエディタ
GitHubの開発チームが作っている？
Language Serverに対応
Electronを使わずにRustで作っている
現時点ではmacOSのみ対応、Linuxは今後対応予定

ポストVSCodeとして期待できるかもしれない、ということで早速インストールしてみました。ほんの少ししか使っていませんが現時点のレビューを書いておきます。全然使いこなしていないので的外れなことを書いているかもしれません。

まずデフォルトでVimモードを選択できます。わかってるなこいつ。

試しにvalue-schemaを開いてみると、ソースコードの解析がすぐに終わりました。VSCodeよりも爆速です。Rustで作っているせいなのか、必要最低限の解析にとどめているのか、もしくは手元のVSCodeに拡張機能を入れまくっているせいなのかわかりませんが、とにかく速い。

定義場所へのジャンプや参照場所の一覧表示もバッチリ。ESLintの設定も自動的に読んで、問題箇所を指摘してくれます。この辺はVSCodeと同様。

エディタ内で端末も使えるのでちょっとした作業も問題なし。

まだ本当に少ししかいじっていませんが、エディタとしては問題なく使えています。ただ、内部にフォーマットルールがあるのか、ファイルを保存するときに勝手にフォーマットをかけてしまうのがｳｰﾝという感じです。多分これは設定をいじれるんじゃないかと思いますがまだ試せていません。EditorConfigにもまだ対応していないようです。

拡張機能にも対応していますが、今のところ使える拡張機能はそこまで多くありません。とはいえおそらくまだサードパーティー製の拡張機能があまり作られていないであろう現状では十分に多いといえるのかもしれませんが。

総評として、公式で謳っているだけあってパフォーマンスは素晴らしい。保存時の挙動が気になる以外は、（サポートしている言語であれば）現状でもソースコードエディタとしては問題なく使え、今後にも期待できる出来です。拡張機能の充実にも期待しましょう。Linuxに対応したらGentoo用のebuildファイルを作って応援します。

開発が進むにつれて機能がてんこ盛り、動作が遅くなる・・・というのはあらゆるソフトウェアの宿命なので、いい感じに折り合いをつけていただきたいです。

そういえば似たようなコンセプトのエディタにJetBrains Fleetがありますが、こちらもまだ正式版ではありませんが頻繁に更新されていますね。

新たなエディタ戦争、楽しみです。

2024年4月14日日曜日

MD5ハッシュの衝突

MD5の新たな衝突が発見されたそうです。

Here is a 72-byte alphanum MD5 collision with 1-byte difference for fun:
md5("TEXTCOLLBYfGiJUETHQ4hAcKSMd5zYpgqf1YRDhkmxHkhPWptrkoyz28wnI9V0aHeAuaKnak")
=
md5("TEXTCOLLBYfGiJUETHQ4hEcKSMd5zYpgqf1YRDhkmxHkhPWptrkoyz28wnI9V0aHeAuaKnak")
— Marc Stevens (@realhashbreaker) March 19, 2024

MD5自体はかなり以前に強衝突耐性が突破されているので、衝突するデータのペアが見つかったこと自体は大したニュースではありません。

今回は「すべてASCIIの印刷可能文字からなる」「1文字違い（さらに言うなら1ビット違い）の文字列が」衝突したというニュースです。

いやすごいんですけど、これどうやって見つけたんだ。

2024年4月7日日曜日

XZ Utils続報

先週XZ Utilsのバックドアのニュース（CVE-2024-3094）を記事にしましたが、1週間して色々な情報が出てきました。

このバックドアを悪用するとSSHサーバーに侵入できるとか、バックドアを仕込んだ人物は数年かけてXZ Utilsチームの信頼を得た後に仕込んだとか、バックドアに気づいたのは本当に偶然だったとか。

今回の時系列は以下のページが詳しいですね。

XZ Utilsにバックドア攻撃が行われるまでのタイムラインまとめ

これを見ると2人組による計画のようにも見えますが、真相はいかに。

2024年3月31日日曜日

XZ Utilsのバックドア

大抵のLinuxディストリビューションに含まれているXZ Utilsにバックドアが仕込まれていたというニュースを小耳に挟みました。

XZ UtilsはLZMAやxz形式の圧縮ファイルを扱うためのライブラリーで、上述の通り大抵のLinuxディストリビューションに含まれています。

バックドアが仕込まれてから発覚するまでが1ヶ月程度だったというのもあって、影響を受けたディストリビューションはあまり多くないようです。あまりいないとは思いますが、ここ1ヶ月ほどの間にソースコードからXZ Utilsをビルドしている方は影響を受けている可能性が高いのでダウングレードしたほうがよさそうです。

さて、我らがGentoo Linuxへの影響はというと・・・Changelogを見る限りこんな時系列でしょうか（日付はUTC）

2024-02-24: 問題のある5.6.0が追加された（ただし、すべてのアーキテクチャで明示的にキーワードを指定しない限りインストールされない）
2024-02-28: 5.6.0の別ビルドバージョン（5.6.0-r1）が追加された
2024-03-04: 5.6.0が削除された（バックドアに気づいて削除したのではなく、より新しいバージョンが追加されたので古いものを削除。Gentooでは頻繁に行われる）
2024-03-09: 5.6.1が追加された（5.6.0追加時と同様、すべてのアーキテクチャで明示的にキーワードを指定しない限りインストールされない）
2024-03-15: 5.6.0-r1が削除された（これもバックドアに気づいて削除したわけではない）
2024-03-24: 5.6.1が安定化された（xz-utilsがインストールされた状態でパッケージの更新を行うと、バックドアが仕込まれたものに更新されてしまう）
2024-03-30: 5.6.1が削除された（バックドアに気づいた）

というわけで、3月24日〜30日の間にパッケージを更新した人がバックドアのあるものを掴んだ可能性が高いです。一刻も早いうどんワールドをおねがいします。

こちらにも諸々やり取りがあります。

2024年3月24日日曜日

円周率105兆桁

円周率が105兆桁まで明らかに、所要時間は70日弱

数学とコンピューター好きの端くれとして、円周率ネタは大好きなんです。中学生くらいの頃は無駄に300桁くらい覚えていたり、円周率の計算式を独自に導出したりしていました（後にすでに発表されていることが判明したんですが・・・）

直近ではGoogleが100兆桁まで計算していて、今回はそれを5兆桁更新したというニュースです。

記事にあるとおり、この計算をしたのはストレージの専門家なのですが、「なぜ円周率の計算をストレージ専門家が？」というところが興味深いので今回ネタにしました。

というのも、こういう計算系はアルゴリズムの工夫によって記録が更新されるように見えますが、近年の円周率業界はy-cruncherというソフトで「チュドノフスキー級数」を計算する・・・という方法が定番で、アルゴリズムはもうほぼギリギリまでチューニングしきっているような世界なのです。

そのため、昨今の円周率業界で一番のボトルネックはストレージのI/O。ストレージの専門家が記録を更新するのもうなずけます。

ちなみに、ガウス＝ルジャンドルのアルゴリズムやボールウェインの4次式のように、理論的にはチュドノフスキー級数よりも格段に収束の速い計算方法はあります。しかしコンピューターで多倍長演算する上では整数の四則演算以外（平方根計算など）をなるべく減らしたいとか、前回の計算結果を利用してさらに多くの桁数を計算するというテクニックを使うために今でもチュドノフスキー級数が使われています。個人的には、ボールウェインの4次式を整数の四則演算だけで多倍長計算できるようなアルゴリズムとか出てきたらなんかアガります。

円周率は決して終わりのないことが証明されているので、おそらくコンピューターがある限り円周率の記録更新はこれからも続くでしょう。

2024年3月17日日曜日

WinterJS正式版

新たなサーバサイドJavaScriptランタイム「WinterJS 1.0」正式リリース、WebAssemblyへのコンパイルも可能。Wasmerが開発

去年の10月ごろに出た新しいJavaScriptランタイムが正式版になったようです。今回の開発元はWasmer。爆速を謳っているBunよりも速いと主張しています。

まだ使ってないので評価も何もできないのですが、元記事をざっと見た感じではDenoやBunとは違ってTypeScriptのネイティブサポートはないようですね。

これでV8（Chrome） / JavaScriptCore（Safari） / SpiderMonkey（Firefox）のエンジンを使ったランタイムが揃ったので、みなさんいい感じに競争してほしいです。

2024年3月10日日曜日

GRUBのブートエラー "error: file /boot/ not found."

先日、Linuxを入れているPCを再起動したら画面にこんなメッセージが出て起動できなくなりました。

error: file /boot/ not found.

Gentoo Linuxを使っているんで時々カーネルのアップデートはするけど、特にブートローダー周りをいじってるわけでもないし現に今まではこういうエラーも特に出なかったし、うーんなんだろなー🤔 このマシン使えないと副業も何もできんし困ったなー🤔

とりあえずエラーメッセージで検索しても原因らしきものは見つからず。仕方ないのでこういうこともあろうかと用意していたUbuntu入りのUSBメモリーで起動し、パーティションをマウント。マウントできたので、とりあえずストレージやパーティションに致命的な障害があるわけではなさそう。

あらためてカーネルの再構築やらgrub-mkconfigやらを実行して再起動。でもまだ同じエラーが出る。

半日近くあれこれ試行錯誤しましたが、最終的にパーティションをマウントしたディレクトリーにchrootしてgrub-installをやり直したら直りました。

grub-install --target=x86_64-efi --efi-directory=/boot/eft --bootloader-id=boot /dev/sda

結局原因はわからずじまいだけど、きっと何かの拍子になんかおかしくなったんでしょう。そうに違いない。

このマシン自体は4年前くらいに買ったやつで、今でもスペック的に大きな不満はないんだけどそろそろ買い換えどきかなぁ🤔

2024年3月3日日曜日

Enpassのバグ報告

ここ数年パスワードマネージャーにEnpassを使っています。機能的に不満はなく、有料ですがサブスク方式ではなく一括払いのプランもあるので愛用しています。

ただ、最近特定の環境でブラウザーのパスワード自動入力ができなくなってしまいました。

詳細はEnpass公式フォーラムに書きましたが、Firefox v123.0のプライベートモードで自動入力機能が使えません。別の環境（Firefox v115.7）では問題ないので、バージョンアップした際にプライベートモードの拡張機能の仕様が何か変わったのかもしれない・・・と推測しているのですが詳しいことはわかりません。

別の環境のFirefoxをv123.0にしたら少しはハッキリするかもですが、動かなくなったら嫌だしなぁ・・・

誰か解決方法を知っていたら教えてください。

2024年2月25日日曜日

「メール一往復主義」をするのは若手？

断られた→返信しない「メール1往復主義」の若手が増加中！タイパ重視の本末転倒

こんな記事がありました。個人的にも確かにこういう経験はあります。

このブログでも度々取り上げていますが、LinkedInなどで明らかにこちらのプロフィールや希望に全く目を通していない（おそらく一斉送信の）スカウトメールが来ることがあります。そういうメールは機械的に弾けるような仕組みを入れているのでスルーするんですが、大体1週間後くらいに「どうしても諦めきれないので再度連絡します」みたいなメールが来ます。それも大抵スルーするんですが、時々気が向いたら「そんなに真剣なのになんでプロフィール読まんのや、ああん？」という趣旨の内容をオブラートに3重くらい包んで送ったりします。まず間違いなく、それ以降先方からの連絡はありません。

こういう経験談は置いといて、冒頭の記事を読んでちょっと気になったところが。

相手は本当に「若手」なんでしょうか？

記事内ではひたすら「若手」が強調されていますが、記事を一通り読んでも「一往復主義を行うのは若手」という確たる根拠はないように見えます。例えば相手が年齢を名乗ったとか、送り主の名前で検索したらSNSで若い人がヒットしたとか、知り合いの会社の人が「うちの若い営業はこんな感じだよ」と言っていたとか・・・そんな話は一切出てきません。

このようなことから、最後の返信を省くことは、現代のビジネス環境においては、不適切ではなく、タイムパフォーマンスから見ても正当化でき、相手にとっても余計な時間を費やさせない正しい行動である、と若手社員は考えているようなのである。

という書き方からして、実際にこういう営業スタイルの若者に聞いたわけではなく、「タイムパフォーマンス的に問題ないから正当化できる、こういう考え方をするのは若者だろう」あるいは「昔は違った、今はこうだ、だからこういうことをやっているのは若手に違いない」という推測が多分に混じっているように見えます。

ただこれは乱暴すぎやしませんか。後者の「昔は違った〜〜」に関しても、新入社員当時のやり方に違和感を持った人が、ベテランと呼ばれはじめた今になってこういうやり方を採用している可能性を排除できていません。

もちろん記事に書いていないだけでどこかで裏を取っている可能性もありますが、記事にするならせめて裏を取っていることくらいは明示してほしいものです。

2024年2月18日日曜日

Install SSH Key v2.7.0を公開しました

Install SSH Keyもだいぶ機能的には成熟してきたので、更新頻度もかなり減ってきました。SSH鍵を使う上での機能は過不足なく揃っていると思います。希望を言い出したらキリがありませんが、ごく一部の人しか使わないようなニッチな機能をつける予定はありません。

先日、半年ぶりくらいに新バージョンv2.7.0をリリースしました。内容は大したことではなく、使用しているNode.jsランタイムをv16からv20へ変更したのがメインです。

先月の時点ですでにIssueには報告があり、親切にもPull Requestが投稿されていました。半月くらい放置して取り込むだけの簡単なお仕事です。報告＆PRを作ってくれた人たちありがとう。

これに伴い、DockerコンテナのUbuntu 16.04とCentOS 7のサポート（CIによる動作検証）を切りました。多分glibcのバージョンの問題で、これらのOS上でNode.js v20は動きません。

2024年2月11日日曜日

排中律という証明方法

数学好きにはよく知られた方法ですが、排中律という証明方法があります。厳密にはこれは証明ではなく「『Aである』または『Aではない』は常に成り立つ」というある意味当たり前の原理なのですが、これをうまく使った証明のやり方があります。

高校までには習わない（というか大学でも習った記憶がない）のですが、考え方は高校数学レベルで十分理解できます。かなり使い道は限られるのですが、個人的にはこの排中律が一番「すげえ！」と思った証明方法です。

2024年2月4日日曜日

Sabayon Linuxの現在

Gentoo Linuxの派生ディストリビューションにSabayon Linuxというものがあります。派生といっても、ソースコードベースで変態御用達のGentooとは正反対の、Ubuntuと同程度に簡単に使えるディストリビューションです。

そんなSabayon Linuxのことをふと思い出したので、どれくらい進化しているか確認しようとしたら・・・

https://www.sabayon.org/

いや進化しすぎぃ！進化しすぎてカジノサイトになっとる！！

譲渡したのかドメインが切れたのか乗っ取られたのか事業変更したのか詳しいことはわかりませんが、どうやら公式サイトは消滅してしまったようです。Wayback Machineによると、2023年3月13日の時点ではちゃんと存在していたものが3月14日にカジノサイトになっているようですね。

開発チームは今どうなってるんでしょうか。GitHubのSabayon orgを見てみると、サイトのURLが変わっているようです。

https://www.mocaccino.org/

モカチーノと読むんでしょうか。Sabayonから新たに派生したみたいです。リポジトリーもmocaccinoOS orgが新しく作られているようです。

何の気なしに「そういえばアレどうなってるんだっけ」から調べたものが、意外と激動していました。

2024年1月28日日曜日

htmxについて

htmxというフロントエンドのフレームワークがあります。というかつい最近知ったんですが。

ここしばらくフロントエンド開発から離れていたので全然キャッチアップできておらずお恥ずかしい話ですが、去年あたりから世界的に流行っているらしいですね。

このフレームワークについての説明は上記の記事や公式サイトに任せますが、これを見たときに最初に思ったことは「ついに来たか」でした。

フロントエンド開発の変遷からして、いずれはこういうものが来ると思っていたのです。

20年ほど前にJavaScriptを使ったリッチなフロントエンドの開発が流行り始めたとき、最初はjQueryやPrototypeなどのライブラリーを使ってDOMを直接操作していました。Ajaxとかいう言葉が騒がれ始めたのもこの頃です。

しかし変数の値が変わるたびにDOMを操作する、あるいはDOMの構成が変わるたびに変数に反映させるという処理はややこしかったので、やがて変数とDOMをバインディングさせるという発想が出てきました。AngularJSやReactです。ReactはVDOMという別の概念ももたらしたのですが、これは別の話。

さて、「DOM直接操作」から「変数とDOMをバインディング」と変遷して開発者はロジックの記述のみに専念できるようになったわけですが、このあたりから「次はそもそもロジックを書かずに済むフレームワークが出てくるんだろうな」と考えていました。

ロジック（≒プログラム）を書かず、イベントが発生したときに呼ぶAPIと、戻り値を反映させる先をYAMLファイルのようなもので指定しておくだけで済めばデバッグの手間も大幅に減ります。なんでも作れるというわけではありませんが、これで十分なウェブアプリケーションも決して少なくない。そんなフレームワークがそろそろ出るだろうと。

このhtmxは、まさにこの思想から生まれたものだと思っています。YAMLではなくHTML内に直接指定ですが、そこは些細なこと。要はロジックを書かずに宣言的にアプリケーションを作れる時代がやってきたということです。

あ、上のアイデア（YAMLで指定する云々）を誰かパクって新しいフレームワーク作ってもいいんですよ？

2024年1月21日日曜日

ZIP爆弾で不正アクセス撃退

不正アクセスに悩まされているサイト管理者は多いかと思います。特に "wp-admin.php" のようなパスへのアクセスがひっきりなしに来るサイトもあるでしょう。そういう不正アクセスに対して面白い（？）撃退方法があるようです。

ウェブサイトに侵入してくる相手にZIP爆弾を送りつけて撃退する方法

小さなサイズの圧縮ファイルが展開すると数GBや数TBに膨れ上がるZIP爆弾と呼ばれるものがありますが、それをブラウザー経由でやるというもの。

これの面白い（？）と思ったところは2つあります。

ブラウザーの標準機能を使っていること。GZIP圧縮によるデータ転送はHTTPの規格で定義されており、ほとんどすべてのブラウザーが対応しています。自動的にデータの展開まで行うので、攻撃者が気づいたときには時すでに遅し。ブラウザーではなくcurlなどでアクセスした場合でも、Accept-Encodingヘッダーを指定していれば自動的に展開されます。

この手法は「攻撃」ではないということ。例えば、UAの脆弱性を突いてリモートコード実行したり、リクエスト側を乗っ取るようなレスポンスデータが含まれていると、逆にサービス側が不正アクセスとみなされる可能性が高いと思います。でもこの手法は単にレスポンスデータが大きいだけなので、それを処理する能力がブラウザー側にないことやストレージの空きがないことはサービス提供者側の責任ではありません。

とはいえ、「攻撃者側を困らせてやろう」と思ってやっているであろうことは変わりないため、いざ裁判を起こされたときにどのように無罪を勝ち取れるかは保証できません^※し、この方法を推奨するわけでもありませんので誤解なきよう。あくまで技術的に面白いと思った（ZIP爆弾自体は知識として知っていましたが、こういう使い方があったか、と感心した）だけです。

※「攻撃するほうが悪い」「攻撃者側が裁判を起こすなんて恥知らずだ」という理屈は法治国家では通用しません。弁護士の腕や裁判官によって結果は大きく変わるでしょう。

2024年1月14日日曜日

機械学習で全然精度が上がらない

最近、seq2seqの独自実装にハマっています。まあ独自実装といってもまだ自慢できるような工夫はほとんどないんですが、翻訳とかチャットボットとかになんか使えそうなのでとりあえずエンジンを作っている段階です。

そんな自作seq2seqを使って試しに英日翻訳エンジンを作ってみたんですが、どれだけ学習させても全くもってトンチンカンな翻訳結果にしかなりません。多分アルゴリズムは合ってるはずだし学習データもネット上で公開されている機械学習用のトレーニングデータを使っています。ただデータ量が多いので、ある程度まとめてミニバッチ学習をさせています。何がおかしいんだ・・・

数日悩んでいましたが、ある日ソースコードを見直して気づきました。

ミニバッチ学習させるときに、パディングの影響を最小限にするためにトレーニングデータを長さ順にソートしています。それはいいんですが、入力と出力を独立にソートしていたため、英文と和文の対応がグチャグチャになっていることに。

対応がずれないように、英文の長さを基準にして「英文・和文のペアの配列」をソートして再学習させたところ、無事それっぽい翻訳結果が出ました。そのうちどこかで公開したり、基礎から始めるseq2seq的な記事を書いたりするかもしれません。

良い子のみんな、学習データの入力と出力は別々にソートしちゃダメだよ！こんなことするのは他にいないと思うけどね！

2024年1月7日日曜日

新年のごあいさつ

あけましておめでとうございます・・・と言える気分ではなく、新年早々大変なことが続いていますがみなさんお元気でしょうか。被災されたみなさんにお見舞いを申し上げます。

こちら（兵庫県）は地震の影響は全くなく、家族の中で揺れに気づいたのが自分だけという状況です。「またいつものザコ地震か・・・」と高をくくっていたところ、ニュースを見て驚きました。

姉の家族が金沢に住んでいるのですが、家具がひっくり返って汚部屋ならぬ汚家になったくらいで人的被害はなし、物流・電気・水道などのインフラも問題なしとのことで安心しました。

金沢以北の能登地方が大変ということで、一日も早い復興を願っています。今年もよろしくおねがいします。

登録: 投稿 (Atom)