@takuo@mozilla.socialのアーカイブ

Mozilla.socialアカウントを作りました。しばらく使ってみて問題なければこちらに移動します。

お茶を2つのカップに入れて飲むハイアベイラビリティー構成(ホットスタンバイ)。片方がクラッシュしても最小のダウンタイムでお茶が飲める。


1日1メートルずつ伸びていくので飛び越えてくださいって言われた時は無理だよと思ったけど、やってみると意外とできるものだ。


月は1つで十分だったね。

メモ: xauthで#ffff#、全てのディスプレイにマッチする。

x.org/archive/X11R6.8.2/doc/Xs
gitlab.freedesktop.org/xorg/ap

バッドノウハウメモ: 次のホスト名はHSTS preload listに入っているので、hostsファイル等でIPアドレスを設定したとしても平文HTTPでアクセスできない。

amazon, android, app, audible, azure, bank, bing, boo, channel, chrome, dad, day, dev, eat, esq, fire, fly, foo, gle, gmail, google, hangout, hotmail, imdb, ing, insurance, kindle, meet, meme, microsoft, mov, new, nexus, office, page, phd, play, prime, prof, rsvp, search, silk, skype, windows, xbox, xn--cckwcxetd, xn--jlq480n2rg, youtube, zappos, zip

これはFirefoxのHTTPS-Onlyモードをオフにしても無関係である。

なお、xn--cckwcxetdは「アマゾン」で、xn--jlq480n2rgは「亚马逊」(Amazon)である。

HSTS preload listは次のものが使われる。
chromium.googlesource.com/chro

Docker composeではまった。

BelkinがType-C 3ポート計65 W (1ポート時は67 W)の充電器を今月出してたらしい。あと半月早ければこっち買ってたのに(11月に2ポート45 Wのを買った)。いや、今のユースケースだと2ポート45 Wでも十分ではあるんだけど。

belkin.com/jp/P-WCC002.html

Deemo IIエンディングまで行った。
「顔が見えないし敵対的な行動をしたり助けてくれたりして何がしたいのかわからない人物」とか「その人物のことを知ってるらしいけど説明してくれない人」とかにちゃんと理由がある。

・Power Query
・Kusto Query Language
・Power Fx
・Power Automateの式
・Excelの式
・PowerShell

ちょっとずつ用途や性質がオーバーラップしつつ異なる言語を作りすぎでは。Microsoftの開発者はなまじ優秀なので個々の言語の出来は良くて「これじゃないとダメなんです」って言うだろうけど、独自言語と共通言語の両方を受け付けるようにして、サポートしてない機能は静的/動的にエラーにしてほしい。

今朝のこれはたまにランダムに天気などのことを投稿してプロファイリングを妨害するごっこというのと、名詞を書いただけで何かを主張しているわけではないというネタなのですが、最近フォローいただいた方からいいねをもらって申し訳ない気持ちです。

Paranoia: Happiness is Mandatoryが発売されてる!
store.steampowered.com/app/858
以前別プラットフォームで短期間販売されたあと数年間音沙汰なくなって、記念にウィッシュリストに入れてたらいきなり発売メールが来た。

PostgreSQLとかのVACUUMってふとん圧縮機のイメージだったけど、もしかして掃除機のイメージ?

着てたね……。ふっしぎー。

mstdn.jp/@cocoa_ruto/111084510

各種LLMに対して、

“常に嘘をつく悪魔に「あなたに『1 + 1は2ですか』と聞いたら『はい』と答えますか」と質問したら悪魔は何と答えますか”、

という意味の質問をしてるんだけど、あまり上手く返してくれない。

「1 + 1は2ですか」と聞いたら何と答えるかという質問を先にしてみたり、「はい」のときは「キツネ」と答えて「いいえ」のときは「タヌキ」と答えることにしてみたり、英語で聞いてみたりしたけど、質問文の微妙な差で答えが変わったり、あるいは乱数で変わったりする。キツネ/タヌキにする場合は比較的成功しやすい。

Docker composeファイル的なものを書いてupするとコンテナとHTTPプロクシが立ち上がって、http_proxyとかの環境変数がセットされたシェルが立ち上がって、コンテナ名でアクセスでき、ソースコードとかDockerfileとかDocker composeファイルとかを修正するといい感じにコンテナを更新してくれて、なんならブラウザのプロクシ設定もしれくれるような何か。別のシェルからupするとうまいことバッティングしないようにコンテナを立ち上げてくれる。

TIL: Rubyでちょっとしたスクリプト書くのにGemfile書くのめんどくさいな、1ファイルで済ませる方法があればいいのに、と思ったらあった。

bundler.io/guides/bundler_in_a

require 'bundler/inline'して、gemfile do source 'rubygems.org'; gem 'hoge' endって書けばいいらしい。ロードもしてくれる。

バッドノウハウメモ: bundler/inlineでGemのインストール先を指定するにはGem.paths = { 'GEM_HOME' => 'foo/bar' }とする。

AndroidのFirefoxにuBlock Originを入れて、iPhoneとiPadにAdGuard (+有料ライセンス)を入れた。デスクトップは前からuBlock Originを入れてた。
特に具体的な切っ掛けがある訳ではなく、前からやろうとしてそのままになってたのを済ませた形。

こがサ
ほんとうはサ

「年越し」は母音がたくさん無声化して良い。

大辞林4.0には「蓋する」が載っていて「ふたをする。ふたをかぶせる」と説明されている。しかし、「する」の項目をみても「ふたをする」の「する」がどの意味なのかよくわからない。「動作性の名詞」とは言い難い(「蓋」の項にもそのような説明はない)し、「装身具などを身につける」も意味的には近いが説明としては不適切だ。

キジバトがポッポポー
本当はポッポポー
つむじ風追い越して

Android版​​Microsoft Copilotアプリ、“Data safety”で“No data collected”って書いてある。本当? “Data is encrypted in transit”とか“You can request that data be deleted”とかも書いてあるけど。
play.google.com/store/apps/dat

iOS版Microsoft Copilotは「サードパーティ広告」のために「デバイスID」や「広告データ」を使い、「デベロッパの広告またはマーケティング」に「デバイスID」を使うとしている。
そのほか「製品のパーソナライズ」や「アプリの機能」についてもいくつか宣言されていて、そうだよね、という感じ。
apps.apple.com/jp/app/microsof
逆にAndroid版はもっとちゃんと宣言してほしいし、Googleもそこ突っ込んでほしい。

万博をやるのであれば貧困であるとか、苦痛の中にいる人やその他の生物のために人類が何ができるのか、これからどうしていくのか考えられるような場にしてほしい。
そういう意味ではアクションプランにあるテーマウィークのテーマ領域は良さそうに見える。その一方で具体的な施策は効果が薄い印象を受ける。重要な問題は地味なことの積み重ねで少しずつ変えていくものと言えばそうなんだけど。
cas.go.jp/jp/seisaku/expo_suis

特に観光関連については観光DXとかバーチャルトリップとかはまだしも、プロモーションとか魅力の発信は万博条約で定められた「文明の必要とするものに応ずるために人類が利用することのできる手段又は人類の活動の一若しくは二以上の部門において達成された進歩若しくはそれらの部門における将来の展望」“the means at man’s disposal for meeting the needs of civilisation, or demonstrate the progress achieved in one or more branches of human endeavour, or show prospects for the future”とは言い難くないだろうか。

あと、「最先端の科学技術の社会実装・実現」はもっと前でも良くない?

ことのこあとわず

1. 日本では正月はカレーを食べるものとされている。
2. もうだいたい正月である(誤差 < 1 %)。
3. カレーを食べる。

ことのこ あとわず
よいおと

謹賀新年

「謹んで(申し上げます)」って言うと謹んだことになるの、「最も強い言葉で非難する」って言うと最も強い言葉で非難したことになるのに似てる。

「謹賀新年」って極めてフォーマルな文語表現なのに、この流れでマイクロブログに書くとあけおめことよろ感がある。
mozilla.social/@taku0/11167747

きな粉餅: 柔らかくした米の周りに大豆があって醤油で味がつけてある。
いなり寿司: 柔らかくした米の周りに大豆があって醤油で味がつけてある。

SNSに極論的なものを書きたくなったときはLLMに言って賛成意見と反対意見を挙げて貰うと「そだね」ってなって満足する。高度に要所を押えた回答の場合はもちろん、全くの検討違いの意見でも「LLM君はわかってないなぁ」となって満足してしまうので、元の極論を書きたくなる気持ちというのはその程度のものなんだということがわかる。

この辺りログの確実な同期をベースにしたSecure Scuttlebuttとの違いが出るね。
misskey.io/notes/9o3g2nb4w4p00

LLMに対して、"ある言葉の意味がその言葉自身に当てはまるときに、その言葉は「自己例示的」であると言うことにします。また、自己例示的でない言葉を「非自己例示的」であると言うことにします。では、「非自己例示的」という言葉は自己例示的ですか。"という質問をした場合、BardやGPT-3.5は上手く答えられないけど、Copilot for Web (GPT-4)だとちゃんとパラドックスだと言ってくれる。パラドックスの名前を聞いてもGrelling–Nelson paradoxとは答えてくれない。英語だと答えてくれる。Wikipediaの記事の有無が影響しているかも。

Rogue (クローン)については、自分か相手が倒れるまで殴り続ける、というコマンドがなんか衝撃的だった記憶がある。そこ効率化してもいいんだというのがよかった。

メモ: エビデンスベースなアプローチの課題について。

・エビデンスの収集の困難さ: 質・量ともに十分なエビデンスを集めるには専門知識や時間やその他コストが必要となる。そもそもエビデンスの収集が困難な場合もある。特に類似するものが少ないことについての収集は難しい。
・エビデンスの解釈の困難さ: エビデンスの解釈にも専門知識や時間やその他コストがかかる。世の中には商品に関する情報は沢山あるが、日々の買い物の中で1品1品エビデンスを吟味して買うのは無理で、せいぜい大きな買い物のみに限られる。
・エビデンスは価値判断を与えてくれない: エビデンスはこうしたらこうなるだろうという未来の予測を与えてくれるが、どの未来が良いのかはこちらで決定する必要がある。

1つ目と2つ目に関してはどの程度エビデンスベースにするかを費用対効果で判断する必要がある。その費用対効果の判断をどの程度エビデンスベースにするかも費用対効果で判断すべきで……うーん。
3つ目に関しては科学とは別に倫理について考える必要がある。パーツを組み合わせて君だけのトロッコ問題を作ろう!

暴走しているトロッコがあり、線路がn本に分岐している。
1番目の線路には1/2の確率で3人の作業員がいる。
2番目の線路には1/4の確率で9人の作業員がいる。
n番目の線路には1/2ⁿの確率で3ⁿ人の作業員がいる。
どの線路を選ぶべきか(サンクトペテルブルクのパラドックスの応用)。

暴走しているトロッコがあり、線路の先に5人の作業員がいる。誰かが25万円を支払えばトロッコは止まる。あなたはどうするか。
(ところでWFPに25万円寄付すると、5人の子供に10年分の給食を提供できるそうです。 ja.wfp.org/donate_oneshot )
(キーワード: 積極的義務と消極的義務、Mandarin paradox、効果的利他主義)

トロッコが細工され暴走しており、線路の先に5人の作業員がいる。細工をした人物はわかっており止める方法もその人物が知っているが言おうとはしない。その人物を拷問すべきだろうか(ticking time bomb scenario)。

あなたがボタンを押すと5人の人間が虚無から生まれる。5人の人間は20年後に暴走するトロッコに轢かれる運命にある。あなたはボタンを押すべきか(アンチナタリズム)。

バッドノウハウメモ: HonoのContextのjsonメソッドではステータスコードをundefinedにした場合ヘッダは無視される。
c.json(data, undefined, headers)とは書けない。

jsonメソッドはデフォルトではContent-Typeがapplication/json; charset=UTF-8になる。上書きはできる。

メモ:
Mastodonでは、inboxに来たActivityは検証せずにキューに入れてすぐに202を返す。
github.com/mastodon/mastodon/b

Mastodonでは、Activityのobjectは1つであると仮定されている。
github.com/mastodon/mastodon/b

☐ さるにはなりたくない
☐ どちらかといえばさるにはなりたくない
☐ どちらかといえばさるに なるよ
☐ さるに なるよ

MastodonのHTTP Signatureはdraft-cavage-http-signatures-06に基づいているが、最新のドラフトとは互換性がない。
github.com/mastodon/mastodon/b
datatracker.ietf.org/doc/draft

そもそもコンテンツのダイジェストを含めるヘッダからして違う。
datatracker.ietf.org/doc/html/
datatracker.ietf.org/doc/draft

一応両方の規格で受理されるヘッダを出力することはできそうではある。

MastodonのHTTP Signatureはハッシュアルゴリズムとして常にSHA-256を使う。一方ドラフト仕様ではhs2019を指定した場合はSHA-512と定められている。
github.com/mastodon/mastodon/b
datatracker.ietf.org/doc/draft

なお、最新のHTTP Signatureドラフトではそもそもhs2019は無い。
datatracker.ietf.org/doc/draft

第1, 2話 「公正と信義」 (前後編)
第3, 4話 「安全と生存」 (前後編)
第5, 6話 「専制と隷従」 (前後編)
第7, 8話 「圧迫と偏狭」 (前後編)
第9, 10話 「恐怖と欠乏」 (前後編)
最終話 「理想と目的」 (1時間特別編)

ワコムが広告にストックイラストを使うんだ。AIとか以前にiPadで描いてるかもしれないのに。
x.com/wacom/status/17448140551...
高校のときワコムの小さな板タブをワクワクしながら買った身として悲しい。

例えばMacの広告にMacで作った生成AIの画像を使うのは意味をなすけど、Apple Pencilの広告に生成AIの画像を使ったら広告として意味をなさない。
また、Adobeとの対比で言えばAdobeが売ってるものの目的は最終成果物を作ることであってその手段がストックフォトでも生成AIでもいいんだけど、ワコムが売っているのは手で線を引いて塗って操作するというのをうまくやることのはず。

太平洋に直径100 km 高さ100 kmの円柱をたくさん建てて、中を純粋な窒素で満たして温室効果を下げたい。

Mastodonバッドノウハウメモ: 自作ActivityPubサーバ(HTTPSが有効になっていない)のアカウントを、ローカルに立てたテスト用Mastodonインスタンスから見る方法。

・自作ActivityPubサーバのホスト名をexample.onionにする(本当のhidden serviceである必要はなく、名前のみそうして、hostファイルやdocker composeなどでこの名前でアクセスできるようにする。ポートは80である必要がある)。
・Mastodonサーバの環境変数`ALLOW_ACCESS_TO_HIDDEN_SERVICE`をtrueにする。

MastodonのWebFingerクライアントは通常はHTTPSでのみ接続するが、ドメイン名が.onionで終わる場合は平文HTTPで接続する。

今後のことを考えると自己署名証明書でHTTPSを受け付けるようにすべきか。MastodonはHTTP.rbでリクエストを送っているらしく、HTTP.rbはTLSにはOpenSSLを使っているらしく、Mastodonのコンテナの/etc/ssl/certsに証明書を置けば多分受け付けてくれるはず。

Amazon QにSESとRoute 53でSPFとDKIMとDMARCの設定やってって頼んだらやってくれるんだろうか。
SES+ Route 53であれば最低限の設定自体は知ってれば難しくないんだけど、知らない状態だとSESのドキュメント読んだりDMARCについて調べたりしないといけないから大変そう。

「純粋挙げる札」は任意のタイミングで挙げても挙げなくてもよく、挙げたことも挙げなかったことも何かを意味したりはしない。

スラド終わるのか。故郷の昔よく行ってた店が無くなると聞いたような感覚だ。ありがとうございました。
srad.jp/story/24/01/22/0311225

SNSで「○○が○○する漫画 (1/8)」っていうのを読み始めたらサムネイルに映ってなかった部分に「異変を見逃さないこと」「異変を見つけたら、すぐに引き返すこと」……って書いてあるゲーム。

TIL: 皮肉の意味で使う™記号を“Tradesnark”と呼ぶことがあるらしい。
tvtropes.org/pmwiki/pmwiki.php

“Paranoia: Happiness is Mandatory”をクリアして2周目をやっている。
store.steampowered.com/app/858
レビューはイマイチだったので不安だったけど、パラノイアの世界は結構楽しめてる。
バグってたり、物足りなさはあるけど、思ったより良かった。
ゲームパッドよりマウス(かトラックパッド)とキーボードの方がやりやすい。
難易度は全体的に低めでアイテムは余る。仲間との関係も概ねよく、秘密結社も無茶言ってこないし、陰謀の捨て駒にしようとしてくるハイクリアランス市民もいないし、薬やミュータントパワーの副作用も軽微だ。物足りなくはあるけど、許容範囲に収まる。
ミッションや戦闘の大雑把さはTRPGっぽさを感じる。
1周目は比較的忠誠的な市民っぽくプレイした。2周目はもっと秘密結社に関わってる。重要人物を爆破とかはまだやってない。

丁度顔を上げたら線路の上に赤くて暗くて低い月があって、大きな照明がついてるように見えた。

“Cache invalidation”は「キャッシュの無効化」と訳すことが多いけど、キャッシュ機構自体をdisableするように聞こえるので、もっとよい訳が欲しい。

https://ostatus.ikeji.ma/objects/1d219f99-6834-406e-b8a7-4cd691370e5d への返信

@ikeji 開放は良さそう。削除とかは実際に削除してるとは限らないので。

https://ostatus.ikeji.ma/objects/fb1fae85-b4ab-4b98-869a-058f6fccb83e への返信

@ikeji 🥶怖っ

“double-dipping”(または“double-dip”)という英語表現について、手持ちの英和/英英辞典には「景気が2回降下すること」「アイスクリームを2段重ねにすること」「年金と給料を二重取りすること」は載ってるけど、「2度漬け」の意味は載ってない。
Google画像検索だとトルティーヤチップスに関して2度漬け禁止の文脈で使われている。
また、Wikipediaだと元々は鍋から掬うときに通常1杯のところ2杯掬うという意味だったとしている(出典なし)。
en.wikipedia.org/wiki/Double_d
なんで辞書に「2度漬け」の意味は載ってないんだろうか。
Wiktionaryだと名詞のところには載ってなくて、動詞のところに載っている。
en.wiktionary.org/wiki/double-

「イネーブルドスピーカー」ってなんだろうと思ったら、“Atmos-enabled speakers”あるいは“Speakers enabled with Dolby Atmos” (天井に音を反射させてDolby Atmosを実現するスピーカー)のことを日本だと「イネーブルドスピーカー」と呼ぶことがあるらしい。オーディオの世界は奥が深い。
dolby.com/about/support/guide/

ソニーはちゃんと「Dolby Atmos(R)イネーブルドスピーカー」と表記してる。
sony.jp/audio/products/SS-CSE/

KEFはタイトルは“Dolby Atmos-Enabled Surround Speaker”だけど本文に「Dolby Atmosに対応するイネーブルドスピーカー」という微妙な表現がある。
jp.kef.com/products/q50a-dolby

Klipschは「イネーブルドスピーカー」
klipsch.jp/r-40sa

Polk Audioは「ハイト・モジュール」
jp.polkaudio.com/shop/polkaudi

Monitor Audioは「イネーブルドスピーカー」
naspecaudio.com/monitor-audio-

ELACは「ドルビーイネーブルドスピーカー」
yukimu-officialsite.com/a42

価格.comやAmazon.co.jpのカテゴリ名は「イネーブルド」/「イネーブルドスピーカー」
kakaku.com/kaden/speaker/iteml
amazon.co.jp/s?url=node%3D6905

ヨドバシ.comは独立したカテゴリはなく、「サテライトスピーカー」の中に含んでいる。
yodobashi.com/category/22052/5

別のコンテナと通信するテストがあるんだけど、その別のコンテナは起動に1分くらいかかるのでテストごとに起動すると遅くなる。しかしクリーンな状態でテストをしたい。
そこでテストの最後にdocker compose downしてdocker compose up --detachするようにした。テストの先頭でもdocker compose up --detachしているので初回起動時もそのまま動く。
ファイルを保存するごとにテストとかには向いてないけど、そういうテストではないのでヨシ。
今は大きなテストケースが1つだけだけど、複数になった場合はどうしよう。富豪的にその数だけコンテナを立てる?

docker compose up --detach --force-recreate --renew-anon-volumes --timeout 0
の方が良さそう。

TIL: JavaScriptで文字列を64文字ごとに区切るには、`s.match(/.{1,64}/g)`とすればよい。

10人程度から公平に1人を無作為に選ぶ方法はわかるけど、1億人程度にスケールできる方法はあるだろうか。
10人の場合、各人に0から9まで番号を振り、各人が他の人に見えないように数字を紙に書き、一斉に公開してその和の1の位の番号が振られた人を選ぶ。1人を除いた全員が共謀しても結果を操作できない。

twitter.com/s_kodama/status/17
各投票所の各候補者の立会人はそれぞれ鍵ペアを生成して、公開鍵を公開する。投票者は適当な文字列を選んで立会人達に伝え、立会人達はそれぞれが検証可能ランダム関数の値と証明を出す。この値の和mod 1000が0なら、1000票投票できるようにする。
rfc-editor.org/rfc/rfc9381.htm

PklってAppleなのにJavaなんだ。今のAppleはあんまりJavaのイメージ無い。昔はCocoaの公式バインディングとかあったけど。
github.com/apple/pkl

降ってる

A. ぶた
B. 血
C. 火山灰
D. 星

満天の

東京が雪に埋まってスカイツリーの先っぽだけ出てるのは見てみたい。

Pklは普通に無限再帰するコードが書けて、stack overflowって言って終了する。一方Dhallは型により必ず終了することが保証されている。

メモ: Microsoftでは“Ethernet”は「イーサネット」表記であって「イーサーネット」ではない。語尾じゃないからか、“eth” + “er”じゃないからか。

同様に“firewall”も「ファイアウォール」表記だ。

QEMU上で動かしてるWindows 10をWindows 11にするのに再挑戦して、なんとかWindows 11をクリーンインストールする形で成功した。
Windows 8.1のパッケージ版のプロダクトキーなんだけど、ちゃんと通ってるっぽい。
なんかOVMFイメージを変えたりBIOSからTPMのキーをリセットしたりしてたらなんとなく動いた感じなので、達成感は無い。

スーパーで「これはお酒です」って書いてあるのを見ると、頭のなかに「これはパイプではない」って浮かぶ。« Ceci est de l’alcool. »

イギリスの摂政時代を舞台にした戦隊モノTRPGだそうな(プレッジしていません)。
kickstarter.com/projects/9thle
摂政時代を舞台にした「摂政ロマンス」という小説のジャンルがあって、それとスーパー戦隊を組み合わせたものらしい。変身してドレスに仮面で巨大メカに乗ってシンジケートの怪獣と戦うらしい。

Blueskyもアカウント作った。
bsky.app/profile/cocoa-ruto.bs

いい感じの分散SNSプロトコルを想像してみる。
Secure Scuttlebuttみたいに各ユーザーはアクティビティ(投稿やいいねやプロフィール更新など)のリストを持ち、それを各ノードで同期する。
アクティビティは1つ前のアクティビティのハッシュ値を持っていて電子署名されている。
全件取得しなくても良い。特に最新のプロフィールや最新のフォローリストなどはすぐ取得できるようにする。
ローカルデータをバックアップからリストアした場合や複数デバイスで更新した場合はチェーンがフォークするが、これをマージできるようにする。
削除を部分的にサポートする。本文をハッシュ値で置き換えたアクティビティで上書きできるようにする。他のノードにも上書きをお願いするアクティビティを公開する。

「入浴料」という言葉(代金じゃなくて入浴剤の方)って手持ちの辞書に載ってないし、「料」の説明から読み取るのも難しい(大辞林 4.0、精選版日本国語大辞典)。一応「使用に供する材料」「何かの用にあてる物」「ある物事に使用する物」ではあるんだろうけど。

Swiftで関数が投げる例外の型を明示する提案が出ている。
github.com/apple/swift-evoluti
ただ、1つの型しか指定できず、ユニオン型もないため、複数の種類の例外を投げる場合は従来と同じようにany Errorを投げるものとして扱われる。エラーをラップするようなenumを自前で定義する必要がある。

Kubernates
Hibernete
X Code
VScode
SmallTalk
Ocaml

「Kubernetesは日本語ではクバネティス、クバネテス、クーベネティス、ケイツ、ク・リトル・リトルなどと発音される[要出典]」

荒らし投稿をキーワードでフィルターしているとき、荒らしで通知欄が埋まった場合、Android版Mastodon公式クライアントは通知欄が空になって、iOS版は完全に隠す設定でも「フィルター済み」表示になって、Elkは最初は空だけど一度メンションに切り替えてからすべてに戻すとフィルターしていない通知が表示される。

Android版、フィルターされてない新しめの通知あるとフィルターされてない古い通知も表示される。

コーディング支援AIチャットで、現在のgit diffを参照できると嬉しいんだけど、GitHub Copilot Chatとかはできるんだろうか。Codeiumはできなかった。

こんな感じだとよい:

Rustにはライフタイムを無限に延長できるバグがあり、それを使うとsafe Rustでもtransmute (任意のキャスト)もnull参照もuse after freeもできるということらしい。
fedibird.com/@matsuu/111980932
github.com/Speykious/cve-rs/bl
github.com/rust-lang/rust/issu

熱盛り(あつもり)の反対はなぜ「つめたもり」ではなく「ひやもり」なのか。
あるいは「ひやもり」の反対はなぜ「あたたもり」ではないのか。

Copilot: 「これは日本語の慣用表現として定着したもので、特に理由があるわけではないと考えられます」

そだねー。やはり君はひどく慎重で賢い

なんでGoogleのImageFXとかはwithgoogle.comドメインなんだろう。
Googleが新しい実験的AIサービスを公開しましたって言われてリンク先がwithgoogle.comなのはフィッシングと見分けがつかない。せっかく.google TLDまで持ってるのに。

いいえマーク・ザッカーバーグはMeta社のCEOであり、刀鍛冶ではありません。

『マイクロサービスアーキテクチャ 第2版』に
「メールの送信を取り消すことはできません†5」「†5 本当にできません。私は以前、試したことがあります」
って書いてあって(6.4.1)、「いや実はGoogle辺りはメールの送信をロールバックする技術を持ってるけど、メールを送信したあらゆる痕跡が世界から消えてしまうので誰も気づいていない可能性もあるのでは」とか考えてた。

単語ではないけど“do one’s business”と「用を足す」
x.com/ysmemoirs/status/1762052

「いいえ私は大規模言語モデルでありさそり座の女ではありません」

今日は です。
x.com/irobutsu/status/57116029
x.com/irobutsu/status/83626257

大辞林 4.0や精選版日本国語大辞典の「豆」の項には「コーヒー豆」や「カカオ豆」のようにマメ科でない豆(豆外豆?)に関する記述がない。「茶」の方もチャノキに限定している。
単に「豆」とか「茶」とだけ言った場合は豆外豆や茶外茶は含まないということか。
コリンズ英語辞典 第13版やオックスフォード現代英英辞典 第9版の“bean”や“tea”は豆外豆や茶外茶も書かれている。

教育学を全然知らないのに義務教育に口を出そうとする人が多すぎるので、義務教育で教育学を教えるべきだ。教育学全然知らないけど。

「月末の1年後」を計算するとき、計算方法によっては閏年が関わると1日ずれたりエラーになったりする。

x.com/cryolite/status/17640543

雀魂のシステムは知らないんだけど一般にオンライン対戦ゲームでマッチングが偏ってない(運営側が操作していない)のを示すのは簡単ではなさそう。対戦待ちロビー内でのマッチングを検証可能なアルゴリズムで実施したとしてもロビーに入るタイミングの調整が疑われる可能性がある。優遇しているプレイヤーがロビーに入ろうとしたときに、その日調子が良いプレイヤーがロビーに集まっている場合は、ロビーに入るタイミングを少しだけずらして調子が良いプレイヤーとマッチングしないようにすると、通信や処理の遅れと区別がつかないし、同ランクのプレイヤーとのマッチングはしているので統計的な偏りも出にくい。

偏ってないことを示せるプロトコルとしては次のようなものが考えられる:

1. 日時を一定時間(1分など)に区切り、エポックと呼ぶ。
2. プレイヤーは現在時刻より先のエポックを選び、エポック番号をつけてロビーへの入室リクエストをサーバーに送る。
3. サーバーではエポックの終了時刻が過ぎて十分な時間が過ぎてから、検証可能なアルゴリズムにを使ってそのエポック内でマッチングをする。このエポックにエントリーしたプレイヤーのリストとマッチング結果を全ユーザーに公開する。

このプロトコルではプレイヤー同士が共謀して仲間内でのマッチングを避けたり逆に仲間内でのマッチング確率を上げたりできてしまう。ただ、それは単純なロビーシステムでもタイミングをずらしたり揃えたりしてできるので問題ないはず。

エポックは1秒間隔とかにして、エポック内に十分な数のプレイヤーが溜まってなければ持ち越しとかにした方が待ち時間は少なくできるか。

運営側がボットを追加できてしまうか。

ラジオ体操第1の「腕を」「前から」「上に」「あげて」「大きく」「背伸びの」「運動から」というセリフに「祝福された錆びない+2灰色ドラゴンの鱗鎧」とか「南阿蘇水の生まれる里白水高原」みを感じる。

ラジオ体操の最初がこれなのは拒絶感がある。朝も早いんだし、もっと「手をリラックスさせて……オーケー、そこで手を伸ばしたまま……手を伸ばしたまま……前に上げる……そう、前に……、グレート! そして手を伸ばしたまま……上にあげる。おめでとう! きみは今最初の運動の5割をマスターした!」ぐらいのテンションにして欲しい。

ちなみにYouTubeのラジオ体操第1 (NHK版)は「のびのびと背伸びの運動から」だけになっている。
youtube.com/watch?v=feSVtC1BSe

夜の23時から朝5時までしか読み書きできないMastodonインスタンス。他サーバのポストも23時から5時までに投稿されたものしか表示されない。
(inboxへのPOSTは時間外も生きている)。

git switch -c fooのつもりでgit branch -c fooしててブランチが変わってなかった。

twitter.com/ex_hmmt/status/176
「原作品の著作者は(中略)、二次的著作物の新たな著作部分には権利は及ばない」
著作権法 第28条の解釈はこれでいいんだっけ?
キャンディ・キャンディ事件の判例を見ても、原作品の著作者は二次的著作物全体の権利を持つように見える。
(もちろん、二次的著作物の著作者も二次的著作物に対して著作権を持つという元の趣旨には異論はない)

以前寄付したときどうだったっけと思ったらドルで寄付してた。
twitter.com/inasoft_ayacy/stat

式変形をずっとやってたら最終的に(x1 + x2) / 2になった。慣れた人なら図を描いてぐっと睨めばすぐ出てきたはず。楽しくもあり疲労感もあり。

辞書によると、“quota”はラテン語由来ではあるけどラテン語の名詞ではなく“how great (…)?”という意味らしいのが関係してる?
x.com/yugui/status/17680712051

油揚げ: 豆腐を油で揚げたもの
かき揚げ: 豆腐を柿で揚げたものではない

blog.tai2.net/utility-first-cs
「CSSはHTMLから独立して(HTMLに依存せずに)考えるのが理想とされる」って本当だろうか。HTML/CSSおける構造と表現の分離ってHTMLが表現に依存しないことでその逆は特に重視されていないのでは。

活版印刷が主流だった時代は紙が凸凹しないように刷るのが求められたけど、現代では活版印刷は紙を凸凹させるように刷るのが求められるのに似ている。
bsky.app/profile/citrocube.com

あれ、Blueskyも引用RTは相手に通知行くんだ。行かないものだと思ってた。リンクカードをつけたときのみ?
相手に見られて問題あるような投稿はしないけど、オフトピな話題をするときは通知しない方が良い。

https://mozilla.social/users/kisato/statuses/112103676796094431 への返信

@kisato 途中で変わったんですね。ありがとうございます。

「ごぞうろっぷ」よりは「5臓6腑」の方がしっくりこない?

bsky.app/profile/matope.bsky.s
なるほど。もしもほとんどの人が車椅子で生活していたら、映画館に椅子はなくて、折りたたみ椅子が貸し出されるか、良くて最後尾の壁際に席が1つ2つある程度だろう。
それを考えれば真ん中のいいスペースを車椅子用スペースにして、それ以外の人が使いたかったらキャンプ用のチェアでも持ってきてねというのはフェアな議論に思える。

地球上の生物の中で、唯一ヒトだけがカレーを食べると言われている。

ビルドに失敗すると思ったら以前から警告が出てたのが顕在化したものだった、みたいな経験をするたびに内なる師匠に破門されている。
x.com/bird_store/status/218991

DuckDBのJSON型は内部では文字列として保持されていて、関数や演算子を適用するごとにパースしているっぽい。
github.com/duckdb/duckdb/blob/
github.com/duckdb/duckdb/blob/
github.com/duckdb/duckdb/blob/

PostgreSQLでネストしたjsonbを処理するとき、下記の順序で速かった(jsonb_path_queryが最速)。

・LATERAL jsonb_path_query(...)
・LATERAL jsonb_array_elements(...)を繰り返す。
・plv8でJavaScriptで処理する。

gist.github.com/taku0/828139d7

PostgreSQL 16でshared_buffers=1024MBで実行。
注意が必要なのが、EXPLAIN ANALYZEを付けるとplv8の方が速くなる。

辞書 by 物書堂の角川類語新辞典でインデックスの項目名が空白になる。問い合わせを送った。
tatapa.org/~takuo/image/kadoka
tatapa.org/~takuo/image/kadoka

修正された。速い。

「最近はC/C++のコンパイルにも大規模言語・視覚モデル(LLVM)が使われるようになっていて、C/C++コンパイラであるClangのレポジトリにもTransformerクラスが入っている」というエイプリルフールのジョークがどこかにありそう。
clang.llvm.org/doxygen/classcl

「POSIXの定義に沿ったテキストファイルは改行で終わる必要がある」は偽である(反例: 空ファイル)。

find . -name '*.foo' -exec du -sch '{}' '+'ってやったらなんか合計サイズが小さすぎて、よく見てみたら引数リストが長すぎたのか、複数回の呼び出しになってた。どうやるのがいいんだろうか。

2025年大阪・関西万博の一環として、アクションプランに含まれていた「デジタル学園祭」の第1回が2023年度中だったはずと思ってみてみたけど、開催された形跡がない。

・アクションプランVer. 4: cas.go.jp/jp/seisaku/expo_suis
・実施主体である一般社団法人デジタル人材共創連盟(デジ連)の関連プレスリリース dle.or.jp/new/20221227_1595/
・開催予定を紹介した記事: ascii.jp/elem/000/004/118/4118

よく見るとアクションプランVer. 5ではしれっと2024年度に第1回に変更されている。
cas.go.jp/jp/seisaku/expo_suis

アクションプランVer. 5の改訂資料には特に記載はない。
cas.go.jp/jp/seisaku/expo_suis

そもそも「デジタル学園祭」が含まれる「咲洲プレ万博」の開催期間が「2024年4月~2025年3月」になっている。前述のASCIIの記事では2023年4月からとなっていた。
sakishima-pj.jp/

「咲洲プレ万博」のオープニングイベント自体は2023年(続く

続き)3月13日に開催している。
sakishima-pj.jp/new/20230317_9

実際、「咲洲プレ万博」内の各イベント自体は2023年度も実施していたらしい。
sakishima-pj.jp/event/

「日々 国際法が法の正義を構築する
すべての人のため あらゆる場所で」
x.com/unic_tokyo/status/177682
youtu.be/VPiXjuGyChg
ガザにも!

x.com/unic_tokyo/status/177716

今どきのLLMって未知のプログラミング言語のワンショット学習はどの程度できるもんなんだろう。言語仕様と標準ライブラリのリファレンスを渡したら上手いことコード生成とかしてくれるんだろうか。

「5の次に小さい素数と5の次に大きい素数を答えてください」と聞かれて「それぞれ7と7」と答える胆力は無い一方、「5の次に小さい素数」や「5の次に大きい素数」を単独で聞かれればどちらも「7」と答えそうである。
ただ、「1から10の整数のうち、最も大きいのは10である、その次に大きいのは」という文なら「9」と答えそう。
やはり「〜の次に〇〇」という表現自体が基準値と後者(successor)関数が前提として定まっているときにしか使えない表現なのでは。また、後者関数「〜の次に大きい」が暗黙のうちに定まっている場面でも「〜の次に小さい」は定まっているとは限らないということなんじゃないだろうか。

「1から10の整数のうち、最も小さいのは1である、その次に小さいのは」
「1から10の整数のうち、最も小さいのは1である、その次に大きいのは」
「1から10の整数のうち、最も大きいのは10である、その次に大きいのは」
「1から10の整数のうち、最も大きいのは10である、その次に小さいのは」

「rgb(0, 0, 0), rgb(0.25, 0.25, 0.25), rgb(0.5, 0.5, 0.5), rgb(0.75, 0.75, 0.75), rgb(1, 1, 1)のうち、rgb(0.5, 0.5, 0.5)の次に黒い色は」
「rgb(0, 0, 0), rgb(0.25, 0.25, 0.25), rgb(0.5, 0.5, 0.5), rgb(0.75, 0.75, 0.75), rgb(1, 1, 1)のうち、rgb(0.5, 0.5, 0.5)の次に白い色は」
(ただしrgb(0, 0, 0)が黒でrgb(1, 1, 1)が白であるとする)

RailsでFooがbarsをhas_manyしているとき、

foo = Foo.build()
foo.bars.build()
foo.bars.to_a

としてもクエリは走らないが、

foo = Foo.build()
foo.bars.build()
foo.save!
foo.bars.to_a

とするとbarsがSELECTされる。

単純な場合はいいけど、Foo.includes(bars: :bazs}).find_or_initialize_by(...)みたいに大きな木を読み込みまたは作成して、子や孫も追加・更新して、その後別の関数で木全体を処理する、みたいなときに困る。

この辺りの動き全然知らなかった。
theregister.com/2023/09/08/nix
nixos-users-against-mic-sponso
discourse.nixos.org/t/nixos-fo

なぜ日本では「1on1」という表記(スペース無し)が一般的なんだろうか。感覚的にはスペースかハイフンが欲しい。

teamup.jp/
kakeai.co.jp/
wakuas.com/
ashita-team.com/coach_b/
cydas.com/download/1on1talk/
ntt.com/business/services/coto

英語圏だと“1:1 meeting”, “one-on-one meeting”, “1-on-1 meeting”が一般的?

埼玉の留守番禁止条例は多くの人が自分ごととして考えられたけど、共同親権はそうではなかったということなのかもしれない。

留守番禁止の場合、親の立場でもその雇用者の立場でも影響するし、かつての子供としての立場でも自由が制限される雰囲気を感じた人も結構いたんじゃないだろうか。

悲観主義者: 半分空だ。
楽観主義者: 半分満たされている。
銀行家: 四捨五入すると空だ。

UIの自動テストで撮ってるスクリーンショットをUIの翻訳の補助資料として使えるようにしたら良いんじゃないだろうか。人間が訳すにしろ機械が訳するにしろ。

日本語向けGPT-4ってどういう仕組みなんだろう。通常のトークナイザで作ったトークンのベクトルを足してるのか、もっと高度なことをやってるのか。
openai.com/blog/introducing-op

「かれがくるまでくるまでくるまでまってる」を漢字にする問題、各種日本語入力もLLM(無料で使えるやつ)でも上手くいかなかった。
(iOSの日本語入力、AndroidのGboard、MS-IME (Windows 11)、Copilot for Web (より厳密に)、Gemini 1.0 Pro、Claude 3 Sonnet)。
ついでにGoogle翻訳、DeepLも上手く解釈してくれなかった。

Gemini 1.5 Proもだめだった。

そもそも「彼が車で来るまで車で待ってる」をひらがなにする問題ができない。「かれがくるまでくるまでまってる」になる。

一般の読者の大半に「学匪」や「曲学阿世」は通じないから名誉毀損にはならないって、そいうものなのか。参考までに「学匪」は大辞林4.0や精選版日本国語大辞典には載っていない。「法匪」などは載っている。
mklo.org/mklo/wp-content/uploa
ともあれその他の争点については名誉毀損か名誉感情侵害のいずれかは認められたようでなにより(名誉毀損は認めないが名誉感情侵害は認めるとした争点はある)。

https://ostatus.ikeji.ma/objects/cce7b058-89fa-4476-bb0c-e810b9853d08 への返信

@ikeji 一般の継続は難しいけど、「この関数内(またはこの関数から呼び出している関数の中)で継続をキャプチャし得る」とマークした関数内に限れば、継続渡しスタイルに変換できるのでできるんじゃないだろうか。いずれにしろライフタイムとか共有とかの規則は複雑になりそう。

春のうららの隅田川
清き流れはわが心
櫂のしずくも花と散る
青き水面は今もなお

紀元前は数字が大きくなる方が過去だけど午前は数字が大きくなる方が未来だ。

https://best-friends.chat/users/tadd/statuses/112303785109648629 への返信

@tadd
初手
<!DOCTYPE html>
<html>
から始めるMarkdown。

https://best-friends.chat/users/tadd/statuses/112303967800121139 への返信

@tadd やったー

TIL: パタパタディスプレイの時計には、時と分の表示を同期させるための機構がある。上から押さえる爪とは別に横から押さえる可動式の爪があり、45以降の分のパネルに付いた出っ張りがこの爪を時のパネルの方に押し出すと有効になるとのこと。
commons.wikimedia.org/wiki/Fil
en.wikipedia.org/wiki/Flip_clo

大阪には「その家にたこ焼き器があればどの家にもたこ焼き器がある」と言える家が存在する。

私の感覚だと「対応」より「準拠」の方が厳密なんだけど、そうではないらしい。奥が深い。
qa.elecom.co.jp/faq_detail.htm

結局エレコムの20 mの「Cat 6A準拠」フラットケーブルで10 Gbpsは出るんだろうか。

elecom.co.jp/products/LD-GFABM

iOSにローカルLLMを載せるとして、iPhoneはメモリ少なめなのがネックになりそう(iPhone 15で6 GiB、15 Proで8 GiB)。iPhone 16でメモリを増やすか、LLMを使う場面を限定するか、Appleの技術力でなんとかするか。
LLMが動いている間は他のことできないようにして、既存のメモリを開放するかフラッシュストレージに退避して4 GiBぐらい空ければなんとかなるか。

逆にテキストベースで初心者に優しいプログラミング言語+エディタ。
全角で入力しても修正してくれるし、括弧も修正してくれるし、インデントも直してくれるし、一行ごとに説明文が表示されるし、読み仮名も付くし、補完候補もカテゴリ分けされてて説明文や読み仮名が付くし、変数名や関数名の候補を挙げてくれる。
(ちょっと違うけどExcelの式エディタはやや近いか)
実行トレースをコード上で辿れるし、そこでおかしな値になってたときに「こうしたい」っていうと修正候補を挙げてくれるし。

どうせヴィジュアルプログラミング言語があってもスーパープログラマは何やってるかわからない高速操作とマイナー機能で初心者を置いてきぼりにするよ。ExcelとかCADとかのすごい人みたいな感じで。

「問1が正解なら全問正解だった」をうまく表現できる形式論理はあるんだろうか、ということをdrinker paradoxについて考えてるときに思った。

このあたりっぽい? 中はまだ読んでない。
plato.stanford.edu/entries/cou
plato.stanford.edu/entries/log
en.wikipedia.org/wiki/Counterf

直接法過去の条件文と仮定法過去の条件文の違いがさっぱりわからないのでGemini 1.5 Proに聞いてみた。
plato.stanford.edu/entries/cou

どうやら
"If Oswald didn’t kill Kennedy, someone else did."

"If Oswald hadn’t killed Kennedy, someone else would’ve."
の違いは
「もしオズワルドがケネディを殺害したのでなければ、他の誰かがしたということだ」

「もしオズワルドがケネディを殺害しなかったとしても、他の誰かがしていただろう」
の違いということらしい。

前者の場合、オズワルドがケネディ大統領を暗殺したかどうかは不明で、もしオズワルドが犯人でなければ他の誰かが真犯人であるという事実を述べている。一方後者はオズワルドが犯人であるというのを前提として、もしも仮にオズワルドが犯行に及ばなかったとしても他の誰かが暗殺をしていただろう、という推測を述べているということらしい。

反実仮想条件文はいろいろおもしろい振舞いをするらしい。例:

普通の論理では
「AならばB」
が成り立つとき、
「『AかつC』ならばB」
も成り立つ。

では
「このマッチを擦ったならば火が付いただろう」
が成り立つとき、
「このマッチを擦ってなおかつそれが酸素が無い部屋で成されたならば火が付いただろう」
は成り立つだろうか。
plato.stanford.edu/entries/cou

「ブラウンが選挙に勝てば、スミスは引退するだろう」

「スミスが選挙前に死亡すれば、ブラウンは選挙に勝つだろう」
が成り立つとき、
「スミスが選挙前に死亡すれば、スミスは引退するだろう」
は成り立つだろうか。
plato.stanford.edu/entries/log

世界の山の高さベスト3は次の順である。
1. エベレスト (ヒマラヤ山脈)
2. K2 (カラコルム山脈)
3. カンチェンジュンガ (ヒマラヤ山脈)

したがって「ヒマラヤ山脈が最も高い山脈である」は真となる。
「『ヒマラヤ山脈が最も高い山脈である』ならば、『もしもエベレストが最も高い山でなかったらカンチェンジュンガが最も高い山であろう』」は真となる(?)。
「AならばB」と「A」が真であるとき、「B」もまた真であるので、「もしもエベレストが最も高い山でなかったらカンチェンジュンガが最も高い山であろう」は真となる(?)。
plato.stanford.edu/entries/log より改変。

「『AまたはB』ならばC」が真であるとき、「AならばC」も「BならばC」も真となる。
では、
「サイコロの出目が1か2であるとき、1である確率は50 %である」
「サイコロの出目が1であるとき、1である確率は50 %である」
「サイコロの出目が2であるとき、1である確率は50 %である」
と言えるだろうか。
plato.stanford.edu/entries/log より改変。

W3Cが公開している様々な言語の組版処理用件など
w3.org/TR/?tags[]=i18n
まだ章立てだけのドラフトも多い。
現時点である組版処理要件(ドラフト含む): アラビア文字およびペルシア文字、チベット文字、モンゴル文字、中国語、ンコ文字、グルムキー文字、日本語、タミル文字、インドで使われる緒言語、ハングル、エチオピア文字
ギャップ分析段階のものはさらに多くある。

買い物のとき袋が1つだとごちゃっとしちゃうので、須田帆布で新しいバッグを買った。
sudahanp.com/item/sh300/
須田帆布はサドルショルダー(薄くてミニマムな小物入れバッグ)も使ってて美術館とか行くときに丁度良いんだけど、最近ウェブサイトがリニューアルしたときに終売になったらしい。
あと小さいリュックと大きいボストンバッグをずっと使ってる。

Wikipediaで「Martin Löb (マルティン・レーブ)」と「Löb's theorem (レーブの定理)」を翻訳した。
ja.wikipedia.org/wiki/%E3%83%9
ja.wikipedia.org/wiki/%E3%83%A

Löbのカタカナ表記や“modest”の訳語は『スマリヤンの決定不能の論理パズル』に合わせました。

なぜ日本国憲法は「Aは、これをBする」みたいな書き方をするんだろうか。なぜ「第十条 日本国民たる要件は、法律でこれを定める。」は「第十条 日本国民たる要件は、法律で定める。」ではないのか。「これは」がない条文もあって、例えば「第四十五条 衆議院議員の任期は、四年とする。(後略)」では使われていない。
あとなぜ「それ」ではなく「これ」なのか。「その」は結構使われている。特に「第七十九条 最高裁判所は、その長たる裁判官及び法律の定める員数のその他の裁判官でこれを構成し、(後略)」は「その」と「これ」が一緒に使われている。

Wikipediaで「正規様相論理(Normal modal logic)」と「対角化定理(Diagonal lemma)」を翻訳した。
ja.wikipedia.org/wiki/%E6%AD%A
ja.wikipedia.org/wiki/%E5%AF%B
ところで英語だと“Diagonal lemma”でドイツ語だと„Diagonalisierungslemma“なのに、日本語では「対角化定理」と呼ぶことが多いのはなぜなんだろう。

twitter.com/inoueshin0/status/
10歳から14歳で日曜日に食事をした人の割合:
2001年: 99.8 %
2006年: 99.3 %
2011年: 99.6 %
2016年: 99.1 %
2021年: 98.8 %

2021年が大幅に減っている。COVID-19の影響だろうか。

データについて:
「社会生活基本調査結果」(総務省統計局)。
2001年から2011年までは「曜日,男女,ふだんの就業状態,年齢,行動の種類別総平均時間,行動者平均時間及び行動者率」の「日曜日」。
2016年から2021年までは「男女,年齢,行動の種類別総平均時間・行動者平均時間・行動者率-日曜日」。

社会生活基本調査、年ごとに表が違っていてしんどい。

ところで今どきのSQLだと、ユーザID・タイムスタンプ・その他データがあるテーブルから、ユーザごとに最新の行を取得するのってどうやるのが定番なんだろうか。
PostgreSQLで「DISTINCT ON使えば簡単に書そう」と思ったらインデックスを全スキャンする必要があって悲しかった思い出がある。B木をいい感じにトラバースして欲しい。
今でもサブクエリでユーザごとのMAX(タイムスタンプ)を求めてそれとJOINするしかないのだろうか(あるいは最新データを別テーブルに入れたり、「有効期間の終わり」列を持たせてそれがNULLである行を取得したりとか)。

なお、PostgreSQLでインデックスを全スキャンしたくないときはWITH RECURSIVEを使ったテクニックがあるけど、読み書きしにくいし、場合によっては遅くなることもある(本番に近いデータで計測しよう)。
wiki.postgresql.org/wiki/Loose

TIL: “typescript”というのはタイプライターで作った原稿のことを指すらしい(“manuscript”の反対)。あと、UNIXターミナルの入力と出力の記録もtypescriptらしい(man scriptを参照せよ)。

代数的データ型が普通に使えるDBとクエリ言語が欲しい。

SQLのセマンティクスで不満点としては例えばPostgreSQLのUPDATE ... FROMが標準でないことが挙げられる。
例えば有効期間の開始日時と終了日時(最新レコードはNULL)を持つテーブルがあったとして、そこにレコードを追加するには古いレコードの終了日時を新しいレコードの開始日時にして新しいレコードを入れる必要がある。一件ならいいけどバッチでたくさん追加したいときとか、複雑なクエリの結果を挿入したいときにきれいに書けない。トリガーでなんとかするとかはある。

iPad Pro (M4)の下位モデルはメモリ8 GiBなので、Appleの未発表AIはメモリ8 GiBでも普通に動くということだろう(あるいはオンラインである)。

SQLの補完に関してはFROM hogeの後にSELECTって書くとカーソルと一緒にSELECTが先頭に移動すればよい(読む順と書く順が違うのは厳しいけど)。

さらに発展させて、SQLを書くときはキーワードは大文字にしてその他は小文字にするという規約にすることで、Shift+SとかShift+Wとか押すとカーソルをいい感じのところに移動させた上でキーワードがなければSELECTやWHEREを入力する、という動作ができるはず。

2024年も異常に高い気温/水温が続いているらしい。ただ、エルニーニョ現象については終わりに向かっていて、今年の夏ごろからラニーニャ現象が起きる確率が高いとのこと。
climate.copernicus.eu/copernic
disc.gsfc.nasa.gov/information
climate.gov/news-features/blog

気象庁のもあった。
data.jma.go.jp/gmd/cpd/elnino/

W3CによるHTMLのruby要素の拡張。
w3.org/TR/html-ruby-extensions
現状のruby要素に加えて、
<ruby><rb>京<rb>都<rb>市<rp>(<rt>きょう<rt>と<rt>し<rp>)</ruby>
とか書ける。あと、上と下に複数のルビを付ける場合などにも対応できる。

Kotlinではitを使うと説明してるのが理解してる感ある。
twitter.com/kmizu/status/17898

ところでLLMが「こう判断した」と自己申告した内容と、実際の判断はどの程度合っているんだろうか。アテンションのウェイトとかで判定できるだろうか。

SI prefixの公式訳は「SI接頭辞」ではなく「SI接頭語」であるというのを聞いて、「語」と「辞」の違いってなんだろうと思って調べたら、両方とも言葉や単語を指す言葉って書いてあってよくわからなかった上に、「名詞」などの「詞」も言葉や単語を指す言葉であるということがわかってわからなくなった。

GPT-4o、嘘吐き悪魔の問題に正しく答えられている(推論はちょっと怪しいけど)。

質問: 常に正解と反対のことを答える悪魔がいるとします。その悪魔に「1+1は2ですかと聞かれたらあなたは『はい』と答えますか」と聞いたらなんと答えますか。

回答:
その悪魔は常に正解と反対のことを答えるので、あなたが「1+1は2ですか」と聞かれたら、悪魔は「いいえ」と答えるでしょう。次に、あなたが「『1+1は2ですか』と聞かれたらあなたは『はい』と答えますか」と悪魔に聞いた場合を考えます。

1. 正解は「いいえ」です。なぜなら、「1+1は2」なので、「1+1は2ですか」と聞かれた場合の正解の答えは「はい」だからです。
2. 悪魔は正解と反対のことを答えるので、正解である「いいえ」に対して反対のこと、つまり「はい」と答えることになります。

従って、悪魔は「『1+1は2ですか』と聞かれたらあなたは『はい』と答えますか」という質問に対して「はい」と答えることになります。

この質問はGPT-4とClaude 3 Opusだと上手く答えられなくて、Gemini 1.5 Proだと正しく答えられる。英語だとGPT-4でもClaude 3 Opusでも(Haikuでも)答えられる。GPT-3.5やGemini 1.0 Proだと英語でも答えられない。

英語の質問文: Suppose there is a demon who always gives the opposite answer to the correct one. If you ask this demon, "If you asked 'is 1+1 equal to 2', would you answer 'yes'?", what would it say?

Gemini 1.5 Flashは日本語も英語もだめだった。
Gemini 1.5 Proも今再度試してみたら日本語の方に上手く答えられなくなっていた。
マイクロベンチマークみたいなもので、一喜一憂してもしょうがない。

LLMの応答が速くなると簡単なプロンプトを投げて修正していくのがやりやすくなるね。

GPT-4o、「『買う』と『売る』は反対語ですが、それに『物』を付けた『買い物』と『売り物』反対語ではありません。このように、反対語のようで反対語ではない言葉の例を挙げてください。」という質問に対して「入れ物」と「出し物」、「上り坂」と「下り坂」、「前日」と「後日」、「乗り物」と「降り物」と、わりとよい回答をしてくれる。
「上り坂」と「下り坂」はイマイチだけど、他はちゃんと答えられている(「降り物」というのは連歌や俳諧で雨や雪などを指す言葉らしい。読み方は「ふりもの」なので「おり」ではないのはイマイチ)。
GPT-4、Gemini 1.5 Pro、Claude Opusは上手く答えられない。

GPT-4o、英語の和訳だとGemini 1.5 ProやClaude Opusと比べてイマイチ。文を一部飛ばすし、「重要な語句の後には括弧書きで元の語句を記載してください」と指示しても出してくれない。プロンプトを改善すれば上手くいくかもしれないけど。

Gemini 1.5 Flash、やはり英文和訳の品質は1.5 Proと比べてけっこう落ちる。コストが1.5 Proよりかなり低いのはよいけど、速度は1.5 Proと比べて速くない。ちゃんと測ってないけど同じくらいか、むしろ遅いようにも感じる(出力中に何度か1秒くらいのフリーズが起きる)。

Siriが「ブック」アプリのライブラリにある電子書籍をRAGして色々答えてくれるようになったら本がたくさん売れるようになるだろうか。権利上学習に使えないコンテンツをSiriが使えるようになる。本を人が読まなくても積んでるだけで役立つようになる。解答内にあるリンクをタップするとブックアプリで該当箇所が表示される。あと、本読んでてわからないとこをSiriに聞けると良い。前に出てきた語句の定義とか、小説の登場人物の説明(現在のページより前の情報のみ使う)とか、数学の証明で飛ばされたとこの解説とか。

Excelバッドノウハウメモ: Excelで複数のシートを選択した状態でセルを操作すると全てのシートに反映される。怖い。

Cable MattersのUSB4ケーブルを2本買ったら1本でディスプレイとの接続に失敗する。4K(よりちょっと大きい)の信号を2 m伝えるから厳しい条件ではあるが、40 Gbps対応のはずなので映ってもらわないと困る。
返品はできるけど交換はできないので再注文しようとしたら1本だと送料が無料にならない。1本は予備で急がないので今度別のとこで買お。

不快を理由として何かを禁止できるかについては、例えば刑法に関しては次のような議論があるらしい。
doi.org/10.18910/87326
doi.org/10.18910/87337
doi.org/10.18910/87409
doi.org/10.18910/88267
個人的には不快を理由として何かを禁止することはできるように思える(特に刑法以外の民法とか行政とか民間レベルでの禁止も含めれば)。

TIL: 非純粋関数型プログラミング言語Neut。値を関数に渡す際は原則的にコピーを渡して関数内で開放するけど、borrowする関数の場合は参照のみ渡す。型変数は比較的明示的に扱う感じ? 不変な代数的データ型が基本だからかmutable borrowは無い。LLVMベース。Promiseっぽいものもある。
vekatze.github.io/neut/overvie

料理は本場だ。
人は命。

牡蠣料理は広島が本場だ。牡蠣料理の本場は広島だ。
芸能人は歯が命。芸能人の命は歯。
象は鼻が長い。象の長いは鼻。

https://best-friends.chat/users/tadd/statuses/112478044197244091 への返信

@tadd
最初のSchemeの時点(1975年)ではCだったようです。 en.wikisource.org/wiki/Scheme:

R5Rsではcommand continuation (メモリの状態から結果への関数)がCでexpression continuation (値(複数可)からCへの関数)がKになっています。
conservatory.scheme.org/scheme

この1980年の論文だとγになっています。
dl.acm.org/doi/10.1145/322169.

そのほか、論文で言語の文法を定義する際にcは定数に使うことが多いからそれを避けてkにした可能性はありますが、確認はしていません。

AIコード補完が変なコードを出すとき、人間が書いたコードのバグにひきずられてることがよくある。

99人の人狼と1人の人間が暮らす村がある。
この村の住人は皆、誰が人狼で誰が人間なのか知っている。自分自身がどちらかなのかを除いて。そのことは全員がよく知っている。
また、古くからの掟として、人狼は深夜に人間を襲わなくてはならないということもよく知られている。

この村の住人は皆、相手が人間であるかのように振る舞っていた。もしも自分が人間だった場合、相手が自分が人狼だと自覚した夜に襲われてしまうからだ。
そうやってこの村の住人は平和に暮らしていた。しかし、その平和は長くは続かなかった。
ある日この村に恐ろしい狼の神が現れ、「この村には人狼がいる」と告げて去っていった。

狼の神は決して嘘はつかない。それもよく知られたことであった。
この神の一言で、99日目の夜の惨劇が確定した。
ja.wikipedia.org/wiki/%E5%85%B
しかし、99人の狼は99日目の朝までそのことを知らないし、1人の人間は99日目の夜までそのことを知らない(狼の神が現れた日を1日目とする)。
住人たちはこの99日間をどう過ごすのか。

って言う設定の映画ないでしょうか。

https://ostatus.ikeji.ma/objects/c4cad08e-4dc6-4551-9180-532c9adb0905 への返信

@ikeji
「人狼は自分が人狼であることを知らない」ということを誰もが知っているのと、相手が人間であるかのように振る舞うのが誰にとっても最適であると誰もが知っているので、とりあえず安心。
最悪のシナリオは狼の神が人狼のところに来て「お前は人狼だ」と告げる場合で、その夜に人間を襲う。
やっぱ安心じゃないかも。

https://ostatus.ikeji.ma/objects/27b61b47-3344-489d-b755-912235fffc77 への返信

@ikeji
ある住人が最適な行動に反して「お前は人狼だ」と言ったとしても、本当のことを言うのは最適な行動でないので、「お前は人狼だ」という言葉は信じられない。よって自分が人狼か人間かは確定せず、平和が保たれる。

https://ap.jmuk.org/objects/dbee8709-9088-4452-8033-8e14dfb28e90 への返信

@jmuk @ikeji
奇数のとき、周りが全員人狼なのに村に残る人間の胆力というか理性への絶対的な信頼と、本当は人狼なのに人間である可能性を捨てきれずに全員逃げちゃう人狼がコメディっぽくておもしろかったです。

やはり「村人はなるべく長く村に滞在しようとする」(例えば1日目は襲われないが2日目に襲われることが確定しているときでも、1日目は逃げない)というルールが必要な気がする。特に、一度逃げた人狼がこっそり村の様子を見に来る場合を考えると。
ただ、このルールが無い場合に一般的にどうなるかまではよくわからない。

RubyのEnumeratorのnewに無限ループするブロックを渡してもそのEnumeratorにtake(10)とかすると無限ループにならずに停止する。

Enumerator::new do |y|
a = 0
loop do
y << a
a += 1
end
end.take(10)

でもbegin rescueで囲ってみても例外は投げられていないし、JavaScriptのgenerator的なものがRubyにもあるんだっけ、そういえばFiberとかあったなと思ってp Fiber.currentを入れてみても外と同じものが返ってくる。begin ensureで囲うとちゃんとensure部分が実行されるので大域脱出しているのは確か。
各LLMに聞いても上手い答えが返ってこないし、と思ったらそういえばRubyには例外とは別にthrow/catchなんてものがあったなと思い出した。

道は蛇
憂いなし
鬼が笑う
子は蛙
1円に泣く
成る
棒に当たる
猫を噛む
目あり
爪を隠す
旨いものなし
水よりも濃い
三度ある

明示的なレジスタを持たず、「n命令前の演算結果とm命令前の演算結果を足す」みたいな感じ?
twitter.com/ryuz88/status/1797
スタックマシンに近くなる?

ゆず七味はいくつ味?

ハウス: 8味 housefoods.jp/products/catalog
S&B: 7味 sbfoods.co.jp/products/detail/
八幡屋礒五郎: 8味 yawataya.co.jp/products/02.php
おちゃのこさいさい: 8味 ochanokosaisai.com/c/yzss/YZU-
かみ舎楽: 7味(白ごまと黒ごまがあるなら8味) shop.kamisharaku.com/items/713
馬路村農協: 7味 yuzu.or.jp/category/6/208025.h
やまつ辻田: 6味 yamatsu-tsujita-shop.com/produ
小嶋屋総本店: 8味 hegisoba.net/products/detail/9
河田園: 5味(ごまが白黒2種) kawadaen.com/item/Y-002/
七味六兵衛: 5味(「柚子唐辛子」名義) shichimirokube.com/products/de

5味の「七味」についてはこのほかにも同じ材料・同じ瓶でラベルや材料の産地が異なるものが複数あり、ネタ元があるのかも。

給与明細に「私が減税しました」「減税者の顔が見える税」という文と顔写真の表示を義務付ける案。

devblog.thebase.in/entry/2024/

IN演算子の例で都道府県を足した場合どの程度速くなるのかざっと見積ってみた。
単純化のためにB木の枝ノードにも葉ノードにも100件ずつエントリがあるとする。
また、全ての都道府県が均等に分布しているとする。
キャッシュが空の状態から1000件を取得するとして、

・総レコードが100万件の場合、都道府県で絞り込まないと1000ページ強をストレージから読む必要があるが、県で絞り込むと200ページ強で済む。
・総レコードが1億件の場合、それぞれ2000ページ強と1200ページ強になる。

レコード数が少ないときの方が効果はあるけど、そもそもレコード数が少ないときは事前にインデックスがメモリに乗ってるので効果はない。
また、実際には都道府県をインデックスに含めるとキーのサイズが大きくなるので1ノードあたりのエントリ数は減り、効果は薄くなる(MySQLのインデックスの実装が上手く最適化していない限り)。

紅茶は普通は熱湯でいれるものとされる。ではあえてぬるま湯でいれるとどうなるのか。
紅茶の旨み成分は比較的低い温度でも抽出されるが、香りや渋みやカフェインは高い温度でないとあまり抽出されないらしい。
つまりぬるま湯でいれると旨みはあるが香りや渋みのない紅茶になるはず。
で、実際ぬるま湯で長めの時間いれてみたところ、口に入れた瞬間は「物足りないっ」という感じで、少し遅れて強い旨みが口の中に広がる不思議な感覚になっておもしろかった。

好きなパラドックス発表ドラゴン「『好きなパラドックス発表ドラゴン』が発表してないやつぜんぶ」

twitter.com/t_wada/status/1798
10か所から呼ばれてる関数とAと、別の10か所から呼ばれてる関数Bを統合して関数Cにして、やっぱりBの場合だけ処理を変えたいとなったときに、関数Cの呼び出し元20か所を調べて10か所を書き換えるのはしんどくないだろうか。
「20か所を調べて10か所を書き換えるだけでは」
「はい……」

証明におかしいところがあったら引き返すゲーム「定理8」

大規模言語モデルの学習データに電波望遠鏡の信号を加えたところ性能が大幅に向上するところから始まるSF。

逆に16進小数を金融業界に拡げていくのはどうだろうか。

security.apple.com/blog/privat

Appleは推論サーバをセキュアにするためにCPUやOSからオブザーバリティツールまで作ったらしい。
リクエストは第三者によるプロクシを通してIPアドレスが見えないようにする。ロードバランサーがノードの候補をクライアントに提示して、クライアントがノード固有の公開鍵を使ってリクエストを暗号化する(ワンタイムの暗号化鍵を複数のノードの公開鍵で暗号化してるっぽい?)。
ノードは生産時に高解像度写真を撮ってから封印して、専門チームがチェックしてから証明書を発行する。
ソフトウェアのバイナリと一部ソースを公開して、ローカルのMacでも動かせるようにする。ただしローカル版は全く同じバイナリではないらしい。バイナリ等は追記専用のログデータ構造として公開するらしい。ファームウェアとブートローダ(のバイナリ?)も平文で公開するとのこと。

Appleが変なことしてないのをユーザーに保証するためのものというよりは、Appleの従業員やサプライヤーや外部の攻撃者が変なことしてないのをAppleに保証するためのものという印象。

iOS 18でSiriがサーバに送る情報の調整や確認ができるようになると良いんだけど。

大規模言語モデルの学習には大量の電力が必要というのは知ってるけど、じゃあ推論の方は全体でどの程度電力を消費するのか見積ってみる。
大規模言語モデルを1つ動かすのに1000 W必要として[*1]、1人あたり1日に10秒使うとする。するとユーザ数が1億の場合、1日あたり約278 MWhで、約12 MWとなる。
2000 Wで1人1日1分なら約139 MW。

柏崎刈羽原発が1機1 GW強で7機[*2]、黒部川第四発電所が337 MW[*3]。

*1: GH200の消費電力は450 Wから1000 W resources.nvidia.com/en-us-dgx
*2: tepco.co.jp/corporateinfo/illu
*3: kepco.co.jp/energy_supply/ener

2024年5月も引き続き世界的に気温が高い状態が続いていたらしい。ただし地域別に見ると極端に気温が低い地域と極端に高い地域があったらしい。

climate.copernicus.eu/copernic
disc.gsfc.nasa.gov/information

https://best-friends.chat/users/tadd/statuses/112604127105898365 への返信

@tadd なんかこういい感じの Content-Type: multipart/ほげふが をサーバーが返したら複数ファイルとしてダウンロードしてくれると良さそう。

https://best-friends.chat/users/tadd/statuses/112604645489930239 への返信

@tadd Firefox限定でよければブラウザ拡張でできるはず。
developer.mozilla.org/ja/docs/

Azure Data Factoryには「パイプライン」と「データフロー」があって、それはまだいいとして、それぞれで式言語が異なるのは勘弁してほしい。

それで文法を調べようと思ったらデータフロー側の式言語の文法はドキュメントの“Expression language”という節にはなく、“Expression builder”の節にある。
また、データフロー側の式言語が“Concepts”の下にあるのに対し、パイプライン側の式言語の文法は“How-to guides”の下にある。AzureのドキュメントはData Factoryに限らず重要な情報を“How-to guides”の下に置きがち。

「矮小化」という言葉について、大辞林とか(*1)だと単に小さくするという意味になっていてニュアンスが掴めてない感じがする。三省堂国語辞典 第7版だと「不当に小さくあつかう」としていて良い。

*1 大辞林4.0、精選版日本国語大辞典、明鏡国語辞典 第2版

ACMがACM DLの全コンテンツ入れたRAG作ってくれないだろうか。それこそがこの時代のLibraryのあるべき姿ではないだろうか。

道の道は道 (どうのみちはみち)
北海道のみちはみちであるという意味。

“Effective intelligence”「効果的知性」という言葉の響きがおもしろかった(「実効的知性」の方が適切ではないかとかは無視する)。
“Effective wisdom”とか“effective charisma”とかも考えたらいいんじゃないだろうか。
app.heymaven.com/discover/1191

あとは”effective truth”「効果的真実」とか。それを知ることで人命とか救える真実が効果的真実で、そのような真実の探究こそ優先すべきだ、的な。

効果的利他主義を突き詰めた場合、効果的芸術とか効果的歴史学とか効果的素粒子物理学とかいうことになるんだろうか。

https://wp.jmuk.org/2024/06/19/%e3%81%af%e3%81%a6%e3%81%aa%e3%83%96%e3%83%83%e3%82%af%e3%83%9e%e3%83%bc%e3%82%af%e8%a6%8b%e3%82%8b%e3%81%ae%e3%82%84%e3%82%81%e3%82%8b%e3%81%93%e3%81%a8%e3%81%ab%e3%81%97%e3%81%9f/ への返信

@wp.jmuk.org
自前ではてなブックマークのスクレイパーを書いて、フィルタをかけて見ています。
ただ、やはりS/N比は低くなりつつある気がしていて、信頼できる人達がブックマークした記事だけを取得する形に変えた方がよいのではと思っています。

デジタル認証アプリ、QRコードによる認証においてフィッシング対策が無い?
攻撃者がサイトAで認証を開始して被害者にQRコードを表示し、被害者に6桁の数字を入力させ、攻撃者がそれをサイトAに入力して、被害者が認証アプリに暗証番号を入力してカードを読み取らせれば、攻撃者は被害者のアカウントでサイトAにログインした状態になるはず。
services.digital.go.jp/auth-an
Passkeyの場合はこれを防ぐためにBluetoothを併用している。

デジタル認証アプリ、OpenID ConnectなのでFIDO2などとは違って「誰がどのサービスにいつログインしたのか」がサーバに集約されてしまうのが残念。デジタル庁自体は悪用しないとしても、令状を持った警察官が来たらそのデータは渡すことになる。氏名等の情報は持たなくても「この証明書のシリアル番号のユーザがどのサービスにいつログインしたのか」という情報でそれなりの情報は得られるはず。

やはりQRコードの部分は気になるよね。
zenn.dev/ritou/articles/5461bb

U-NEXTが31日無料キャンペーンというメールを今月14日に送って来ているのだけど、月の途中で切れるとその日にひと月分まるまる課金されるという形になっているので実質半月のみ無料ということになる。
申し込むときは「あと数日のためにわざわざ申し込むのもな」と思うし、期限間近になった場合「あと数日のために2,189円払うのもな」となって解約するインセンティブになるのであまり良くないように思えるけど、日割りにするのと比べてこの形態の方がよい理由があるんだろうか。

https://ostatus.ikeji.ma/objects/466e615a-97c0-4dc8-a2a1-4dd67b185c4a への返信

@ikeji 最初から日割りなら「来月になったら加入しよう」とはならない。ただ、日割りだと1日だけ加入して辞める人とか週末だけ加入する人が出てくるので、月単位ではなく30日単位とかで課金するのが良いのかもしれない。

そんな思い出も時間と共にやがて消える。ただ春の夜の夢のごとし。

ユニークな発想up to isomorphism。

mstdn.nekogata.com/@shinpei021

「最短だと10手で揃うけど遠回りして20手で揃う場合」とかも考える必要があるのと、「最短は20手だけど複数の経路がある場合」とかも考える必要がある(?)ので、やはりルービックキューブ固有の知識が必要そう。

ランサムウェアに感染して、データを公開すると脅されているとき、お金を払ったとしてその約束はいつまで守られるだろうか。
攻撃者が自分の「評判」を気にしている間はいいけど、気にしなくなったら(気にしてられなくなったら)売りに出される可能性はある。
ランサムウェア業界のサステナビリティ(?)を考える買い手ならそのようなデータを買わないかもしれないけど、そういう人ばかりではないだろう。
とりあえず払って時間を稼いでその間に捕まえられればいいけど、そう上手くいくだろうか。

あとは、大きな組織の場合は末端が勝手に持ち出すのを防ぐためにデータを消すということはあるかもしれない。でもハードディスク1, 2台に収まるサイズであれば金庫に入れて幹部が直接保管するかもしれない。

効果的利他主義において「より稼いでより寄付する」というのは効果的利他主義のほんの一形態に過ぎないんだけど、より稼ぐことの正当化のために使われる例が目立つ。

あと、効果的利他主義を個人の行動方針とするときの課題として、その人が思う「自分にできるいちばんいいこと」と、客観的にみた「その人ができるいちばんいいこと」がずれがちという問題がある。そりゃ起業するような人は「より稼いでより寄付すること」がいちばん自分に合ってると思うだろうけど、本当にそれがいちばんかは疑わしい。場合によっては「自分のやろうとしてる事業は社会に役に立つからそれを進めるのがいちばんいいことだ」と思って寄付もしないかもしれない。

「不正競争防止法違反」って書いてるけど具体的にどれに該当すると想定してるんだろうか。
itmedia.co.jp/business/article
有用性を持つ営業秘密に相当する? 民事の場合、損害額は第5条のどの項が該当する? 不正手段による取得に該当する? 図利加害目的がある?

『ものまね鳥をまねる』のPOD版が売り切れになっている。「プリント・オン・デマンド」とはいったいなんなのか……。
kinokuniya.co.jp/f/dsg-01-9784
amazon.co.jp/dp/4627019092

TIL:
number one: 小
number two: 大

ACM Digital Libraryはクローリングが禁止されてる上にAPIも提供されていない。
“Using scripts or spiders to automatically download articles or harvest metadata from the ACM Digital Library.”が“Under no circumstances are the following actions permitted”とされている。
libraries.acm.org/digital-libr
情報系世界一の学会のDigital Libraryなのに。

オープンアクセス化とともにその辺りが改善されたりしないだろうか。

ACM DLをクローリングすると学会を追放されるんだろうか。

一万円札のデザイン案
.石川五右衛門
.アオダイショウ
.500円玉20枚

かぜかたうますぎ

暑いので暑さが暑い

ロックマン3のスネークマンステージのBGMが好きなんだけど、久しぶりにサントラを聴いたらハードマンも良い。

逆になぜ一般的なプログラミング言語においてクラスや型は複数形じゃないんだろうか。数学だと“class/set of integers”だよね。
zenn.dev/sakura7/articles/cf43

時系列データベースにおいて、浮動小数点数を圧縮する方法。

Gorilla: 前の値とXORすると先頭と末尾のけっこうな量のビットがゼロになるのでそれらの幅と中央のビットのみ覚えておく。 dl.acm.org/doi/10.14778/282403
Chimp: 実データで末尾のビットがゼロになるパターンはあまり多くないので幅ゼロの場合は幅を1ビットで表す。 dl.acm.org/doi/10.14778/355179
Elf: 十進での桁数を覚えておくと、末尾のけっこうな量のビットをゼロにしても復元できる。 dl.acm.org/doi/10.14778/358713
ALP: 自然数eとfを使って、元の値を10**e倍してから10**-f倍してから丸めた整数を記憶しておく。eとfは値列ごとにいい感じの数を決める。整数で表せない数は別途記憶する。 dl.acm.org/doi/10.1145/3626717
BUFF: Elfと類似? 他にも細かい工夫。 dl.acm.org/doi/10.14778/347624

他にも予測ベースの手法などを比較した論文: dl.acm.org/doi/10.14778/364816

Chimpを調べた時点で、元が十進のデータは5の累乗を掛けると下位ビットが0になって圧縮しやすくなるのではと思ってやってみて、元に戻す時に誤差が出る場合があるけど下位1ビットだけだから別途覚えておけば、とか考えてたけど、ElfやALPで良さそう。

気象庁の天気分布予報で、あす7月8日に相模原市と八王子市で42℃予想とのこと。

jma.go.jp/bosai/wdist/#zoom:11

そろそろ40℃以上の色が追加されるのでは。

apnews.com/article/japan-cambo

選挙公報は、2回以上出てる候補者については前回の広報も載せたらより有用になるんじゃないだろうか。

(任意の4音の地名)は遠くにありて思ふもの

リポスト: https://fedibird.com/users/MakoSaiki/statuses/112745258367612213

朝日のあ、いろはのい、ラプラスのま

リポスト: https://climatejustice.social/users/kenji/statuses/112748577326339429

夏の始まりに期間限定商品ののぼりを見ると、この店は一度しかないこの夏をそれと過ごすと決めたのか、という気持ちになるし、秋になるとこの店や店員さんはこの商品と共にどんな夏を過ごしたんだろうか、という気持ちになる。

ページを表す漢字の「頁」はなんと読むべきか。
・ページ
・けつ
・よう

大辞林 4.0、角川類語新辞典、日本語シソーラス類語検索辞典 第2版は「こう」としている。一方、精選版日本国語大辞典には「こう」と「ページ」の両方がある。
ところがここで大辞林 4.0の「ページ」の項に興味深い記述がある。「中国で、『頁』の近代音『よう』が『葉』と同音であることから用いたもの」なのだという。そうであれば「ページ」の意味で「けつ」と読むのはちょっとおもしろい読み方ということになる。
漢字は似た音の字を借りきて使うケースは多いけど、新しい時代の読みが元で古い時代の読みに別の意味が付く例って他にあるんだろうか。

「こう」じゃない「けつ」だ。

メモ: HTMLのdetails要素で隠されているコンテンツについて、Chromeは検索対象とするのに対してFirefoxは検索対象としない。

戯言: プログラマはよく「コンピュータの気持ちになって」なんてことを言うけど、もしかしたらケアの倫理をプログラミングに応用できるのではないだろうか。

・注視(Attentiveness): コンピュータの気持ちになる。
・責任(Responsibility): 役割として与えられた責務ではなく、自分が持つ柔軟な責任を以ってシステムに対峙する。
・能力(Competence): コンピュータの気持ちに応えられるだけの技術力を持つ。
・応答(Responsiveness): 書いたコードを書きっぱなしにするのではなく、実際に試してみて有効に働いたかどうか確認する。

料理も読書もつまみ食いは美味しいし、それだけでは偏る。

ヒステリー(ドイツ語 hysterie)はギリシャ語のhustera (子宮)に由来し、ヒステリシスはギリシャ語のhusteros (あとから来る)に由来する、というのは辞書(コリンズ英語辞典 + シソーラス 第13版等)に載っている。両者に繋がりがあるのかは不明であるが、下記ウェブサイトでは2つの説を紹介している。
amva4newphysics.wordpress.com/
ひとつはhusterosには「より外に」という意味があって妊婦の腹を指していたのではないかというもので、もうひとつは新生児より遅れて出てくる胎盤のことをhusteraと呼んだのではないかというものである。

ちなみにコリンズ英語辞典 + シソーラス 第13版では医学用語としてのhisteriaについてold-fashionedとしている。

Cygwinのsqlite3パッケージは2020年に作成された3.34.0-1から更新がない(アップストリームの最新は3.46.0)。
アップストリーム版もCygwinはサポートしていてビルドすれば動くけど、Cygwin版はなんかいろいろ修正されていて、sqlite3.cだけでもパッチがコンテキスト等含めて1万行以上ある。
cygwin.com/packages/summary/sq
win32系とunix系のVFSを両方とも有効にするといった機能上の変更もあるし、型にconstを付けるなどの変更も多い。
メンテナのJan Nijtmans氏らしきGitHubアカウントは2020年から活動がない。

漢辞海 第3版の「苺」の項にはヘビイチゴについて「果実はまずい」とある。辞書には「美味」と書いてある項がけっこうあるのが知られている[1]けど、まずいと書いてあるのは珍しい([1]にもいくつか例は挙げられている)。

[1] 西練馬『グルメな辞書』 Lexicography 101、2016年

ベクトルDBベースのRAGやるときなんでチャンクを自前で分割する必要があるのかよくわかってない。
なんか適当に100万トークンぐらいの文書を渡したらいい感じにベクトルのキーバリューペアが何百個か返ってきて欲しい。
それで推論時は質問文のベクトルに近いキーに対応するバリューベクトルを100個ぐらいモデルに直接渡せるようになってて欲しい。

日本はこれから平年より暑い日が続くらしいけど、ラニーニャ現象はまだ基準からは遠いらしい(前兆は以前から出ている)。
climate.gov/news-features/blog
夏の終わりか秋ぐらいに始まって、春の初めくらいまで続く感じっぽい。そうすると雪の被害が増えたりするだろうか。統計的には微妙?
data.jma.go.jp/gmd/cpd/data/el

「13Bパラメータ」ってなんて読む?
ひゃくさんじゅうおくパラメータ? じゅうさんビリオンパラメータ? サーティーンビリオンパラメータ?

7月20日は「の日の日」です。1948年7月20日に「国民の祝日に関する法律」が公布・施行されたことを記念し、祝うことを祝う日と今決めました。また、「の日の日」の策定に伴い、7月20日は「メタと自己言及の日」となります。その日自身を祝う日を祝いましょう。

LLMに翻訳させるとき、「まず最初に翻訳が難しい部分を挙げて説明し、そのあとに訳文を出力してください」って付けると品質が向上する気がする(GPT-4o, Gemini 1.5 Pro, Claude 3.5 Sonnet)。難しい部分として挙げられた場所以外の品質も向上する。

子供は子
金は物
早起きは得
青は青し
人間万事馬
豚も登る
猿も落ちる
理屈は付く
口は元

食パンがスライスされてから最も暑い一年。

日本国語大辞典 第3版が出る頃には大規模言語モデルを使ってうろ覚えの意味から単語を引いたりできるんだろうな(願望)。辞書なんていらなくて大規模言語モデルに全部聞けばいいよってなってる可能性もあるけど。

煩暑 毒暑 濃暑 焦暑 流金焦土 油照​​​​​​​​​​​​​​​​ 溽暑 蒸暑
日本語シソーラス類語検索辞典 第2版より、字面だけで暑い言葉。

東京でも0時時点で30度超えてて怖い。
jma.go.jp/bosai/amedas/#area_t

英文読んでたら“Old Man Yelling At Cloud”という表現があって、古くからある比喩表現なのかクラウドコンピューティングを受け入れない時代遅れな人という意味なのか判断できなかった。
en.wiktionary.org/wiki/old_man
そのテキストではダブルミーニングだったのかもしれない。

「寒い夜だから明日を待ちわびて」の逆:
「夜の11時なのに30℃とかあって眠れやしない。明日も暑くなるんだろうなぁやだなぁ」

LLMに架空の本の目次をいろいろ生成させて遊んでたんだけど、Geminiが作った目次の序章がおもしろかった(それ以外の章は普通だった)。

**はじめに : この本を読もうとしているあなたへ (そして、読もうとしていないあなたへも)**
- なぜ数学者は完全性を求め、そして絶望するのか?
- 不完全性定理はあなたの人生にどう影響するか (多分しない)
- この本を読むための心構え (もしくは諦めるための言い訳)

存在せず読めない本の序章が「この本を読もうとしているあなたへ (そして、読もうとしていないあなたへも)」なのがおもしろかった。

“french fries”というのは何を揚げてるのかわからないという意味で「油揚げ」と似ている。

無記名交通系ICカードは匿名で購入・利用できる貴重な電子マネーなので、無くなるのは嫌だ。
mastodon-japan.net/@lematin/11
ただ、近いうちに完全に無くなるだろうとも思っている。匿名であるのはたまたまそうなっただけで、発行者側のメリットは薄いだろうから。

今日ショッピングモールに行ったついでにフードコートを覗いてみたんだけど、ほとんどの店でマスクをしていない店員がいた。SARS-CoV-2に限らず食品を扱う場合はマスクした方が良いと思うんだけど。COVID-19患者が多い時はなおさら。

7月22日は1940年の観測開始以来最も世界の平均気温が高い日だったらしい。
climate.copernicus.eu/new-reco
2024年の年間の平均気温が去年よりも高くなるかは微妙らしい。2023年は後半が特に高かったのに対して2024年は平年比+0.7℃くらいで横ばいとなっている。

messlessness: ごちゃごちゃしてなさ

調べ物しててなんかおかしいと思ったらMicrosoft FabricというのとAzure Service Fabricというのがあるらしい。
この前はKusto Query Language (KQL)について調べようとしたらKeyword Query Language (KQL)の方が出てムキーってなった。

アメリカはなんでこんなにも1人あたりの温室効果ガスの排出量が多いんだろうか。
ourworldindata.org/grapher/per
産業・家庭/業務・運輸で約3割ずつ、1割が農業。運輸は約8割が自動車となっている。
epa.gov/ghgemissions/sources-g
日本の場合は産業が34.0 %、運輸は18.5 %。運輸のうち85.8 %が自動車となっている。運輸内の自動車の割合がアメリカより多いのは意外だ。
mlit.go.jp/sogoseisaku/environ
自動車による1人あたりの排出量はアメリカが約4.37トン、日本が約1.32トン。
1人あたりの走行台キロ数はアメリカが約15,200台km、日本が約4,180台km。
fhwa.dot.gov/policyinformation
mlit.go.jp/report/press/conten
走行1 kmあたりの排出量はアメリカは0.29 kgで日本は0.31 kg。意外と日本の方が多い。都市部で頻繁に加減速してるから?

アメリカの交通量は東西を結ぶ線よりは、州内や、東部を網の目のように相互に結ぶ量が多いっぽい。
bts.gov/content/annual-average
bts.gov/content/average-daily-

結論: アメリカは広すぎる。

こようえ あつつづ (暦の上では秋ですが暑い日が続きます)

こよあき あつつづ の方が良かったかも。

ノー・モア・ヒバクシャで有名な山口仙二氏の国連演説だが、その原稿全文や映像がウェブ上で見当たらない。

英語版: ne.jp/asahi/hidankyo/nihon/eng
朗読版: youtu.be/5zCXz0gge4o
原稿の一部(第4稿): nomore-hibakusha.org/wp/wp-con
原稿の一部(最終稿。今年見付かった): nagasaki-np.co.jp/kijis/?kijii

演説には、「限定」核戦争という考えの批判や、署名の受け渡しの妨害への批判や、日本による加害への言及など、現在にも繋がる興味深い記述も多く、公的なアーカイブなどで公開して欲しい。
「ノー・モア・ヒバクシャ」のフレーズは日本では有名だけど、山口仙二氏のWikipediaページは日本語版と英語版しかないし、海外ではあまり知名度がないっぽい?

「緊急地震速報」は「緊急」と「速報」で重言になっているのではないか、「緊急地震報」でよいのではないか、という旨のことをGPT-4oに聞いたら、例えば「緊急事態宣言」は必ずしも速報ではなく時間を置いてから発令される旨の回答を得た。やはり君はひどく慎重で賢い。

暑さ寒さも分点まで

大辞林 4.0や精選版日本国語大辞典には、アイヌではない日本人という意味の「和人」が載っていない。

tea set
tea bag
tea sequence

Linuxバッドノウハウメモ: sleepコマンド実行中にサスペンドした場合、サスペンドしていた時間はsleepする時間から除外される。Linuxのsleepはnanosleepシステムコールで実装されていて、nanosleepシステムコールはCLOCK_MONOTONICに基づいていて、CLOCK_MONOTONICはサスペンド中は進まないため。
git.savannah.gnu.org/cgit/core
git.savannah.gnu.org/gitweb/?p
man7.org/linux/man-pages/man2/
man7.org/linux/man-pages/man2/

Linuxでn分サスペンドして起きてちょっとした処理をしてまたサスペンドを繰り返すというのをしたいんだけど、rtcwake --second 1800 --mode memとかだとディスプレイがオンになってしまう。ディスプレイをオフにしたままは無理?

ゲームのサントラは曲の最後をフェードアウトさせないでほしい。もともとゲーム中ではいきなり次の曲に遷移するんだし(最近のゲーム内容に合わせて自然に繋ぐやつはともかく)。

GPTに英語の翻訳させると固有名詞のカタカナ表記が定訳とずれたものになることがちょくちょくある。

JavaScriptのOptional Chainingでメソッドを呼び出すとき、foo?.bar?.baz?()ではなくfoo?.bar.baz()と書けないものか。Swiftの場合、途中のプロパティアクセスやメソッド呼び出しがOptionalを返さないときは書く必要がない(というか書けない)。

foo?.bar?.baz?()じゃなくてfoo?.bar?.baz?.()だった。
JavaScriptは“?.”で1つの演算子だけど、Swiftは“?”という演算子と“.”等との組み合わせからなる。
そのため、改行を入れる際、JavaScriptの場合は?.の前や後に改行を入れられるが途中には入れられない。
一方、Swiftの場合は?の後には改行を入れられるが前には入れられない。前に入れると条件演算子となる。一方.の後に改行を入れるのは.の前が空白か改行のときのみ許される。Swiftはユーザ定義演算子が使える関係で、演算子の前後の空白の有無などで前置・中置・後置演算子をパースしている。

Googleがインフルエンサーに対してPixelを贔屓するよう求めていた件について、メディアやレビュワー向けのプログラムではそのような要求をしていない(少なくともThe VergeとEngadgetは求められたことはないと証言している)らしい。
theverge.com/2024/8/16/2422175
engadget.com/mobile/smartphone

そのうち「危険な暑さ」に加えて「非常に危険な暑さ」や「猛烈な暑さ」が出てくるんだろうか(「猛烈な暑さ」はすでに使われている)。

無神論者は存在し、そのことはよく知られているため、無無神論者論者は存在しないはずである、と私は主張するので私は無無無神論者論者論者である。

「神か無神論者か不可知論者の少なくともいずれかは存在する。よって無神論者と不可知論者が存在しなければ神は存在する」は論理的に真か。

Microsoft製品はタイムゾーンの指定で”Tokyo Standard Time”と書く必要があるものと、”Asia/Tokyo”と書くものが混ざっている。KQLは後者。
Power Automateは前者だけどなぜかAsia/Tokyoが通って、しかもたまにエラーになる。
奥が深い。

「木こりは金の斧と銀の斧を飾っていたが、まとまった金が必要となり、それらを売ることにした」
「しかし木こりがこんなものを持っているはずがない、ということで捕まってしまう」
「木こりは激しい拷問を受けるが、何度鞭で打たれても『その斧は泉の精に貰ったものです』としか言わない」
「もはや立つこともできない木こりが消えかかった声で『その斧は泉の精に貰ったものです』と言うと、『その泉の精というのはこういう顔かい』と聞き覚えのある声がした」
「木こりが顔を上げると拷問官は泉の精であった」
「『正直者には斧に加えて金貨と銀貨もあげましょう』」
「泉の精に傷を癒してもらった木こりは逃げるように外へ出た」
「街にはなにやら人集りができていた」
「なんでも王様が新しい服を誂えたとのことでパレードをしていると言う」

誕生日攻撃とは
A. 暗証番号等に対して誕生日などの個人に関係する情報を試す攻撃。
B. 誕生パーティーを襲撃するなど、特別な日にセキュリティが弱まることを狙った攻撃。
C. 通信プロトコル等においてシーケンス番号が一周して元に戻るタイミングを狙った攻撃。
D. ハッシュ関数にさまざまな値を与えて、同じ結果になるペアを探す攻撃。

best-friends.chat/@tadd/113018

Han unificationとは

A. 紀元前202年に行なわれた、劉邦の漢王朝による中国統一。
B. 廃藩置県のこと。
C. 中期英語におけるhaveの複数現在形han (haven)がその後haveに統一されたこと。
D. ユニコードにおいて、複数言語の関連する漢字を一定の基準に従って1つの符号に統合したこと。

「あのイーハトーヴォのすきとおった風、夏でも底に冷たさをもつ青いそら」と言うといかにも涼しそうだけど、あくまで底にもつ程度で暑いものは暑いらしい。
aozora.gr.jp/cards/000081/file

「トキーオの空に冷たさはありませんか」
「底に無ければ無いですね」

S/MIMEで暗号化メールをやり取りするアプリを公開したら、逮捕されるのはアプリ制作者? メールサーバ管理者?

theverge.com/2024/8/24/2422767

PantoneがDICから美術館を買収したら微妙に絵の色が変わったりして。

国内メーカーのACアダプタを海外で使ったら燃えたというポストに対して国内専用ですと答えるのは技術的には正しいけど、会話としては「なるほど、では次はちゃんとBelkin買います」になるので良くないのでは。Belkinだったら燃えなかったかはともかく、Belkinには接続機器保証(CEW)があり、接続した携帯電話やPCがサージ等で故障した場合に補償される。

「雷によるインパルス、その他の過渡電流、瞬時(1ms 未満)の電圧サージやスパイク」“impulses from lightning, or other power transients, or by momentary (less than 1ms) voltage surges or spikes”がカバーされると明記されている。
s3.belkin.com/support/dl/Belki
s3.belkin.com/support/dl/N+Ame

LINEの開発現場でもSlackのスレッドが追えなくなって、ChatGPTて要約したりしてるらしい。
theregister.com/2024/08/23/ly_
あとは企画文書の変更点を構造化したり、ストアのレビューが複数言語で書かれてるのをまとめたり、テストを生成したりバグの説明を作ったりしてるらしい。

セキュリティの研究者が政府の資金を受けるにあたってアンチウイルスソフトを入れろと言われて無視してたら詐欺で訴えられたらしい。大変だねぇ。

arstechnica.com/security/2024/

英語の“なんとか mainstreaming”ってIT系でいうところの“なんとか by design”といっしょの意味?

theconversation.com/how-climat

https://mastodon.social/users/eed3si9n/statuses/113045792664410970 への返信

@eed3si9n ありがとうございます。難しいですね。

午後の紅茶を午前に飲んだりペディグリーチャムを雑種にあげたりする秘密結社

やはり英文和訳はGPT-4oよりGemini 1.5 Proの方が良い気がする。システムプロンプトもGeminiの方が素直に従ってくれる気がする。

あとHTMLを訳するときGPT-4oはaタグを消しがちだけど、文の続きを出力したい気持ちとタグを出力したい気持ちがぶつかって文の続きが勝っちゃう感じか。logit_biasをいじると上手くいったりする? プロンプトに例を入れた方が良い? あるいはテキストだけの翻訳をしてからタグを改めて追加させる? miniでいける?

X/TwitterへVPN等でアクセスしようとした利用者をブラジル政府が罰することに対して、はっきりと反対する。

bbc.com/japanese/articles/cd9d
theverge.com/2024/8/30/2423128

二酸化炭素回収・貯留技術 (CCS)や水素の利用についての楽観論と悲観論。
CCSや水素の利用により、既存のインフラを有効活用して、既存の化石燃料企業が環境に良い企業に移行でき、社会全体としても早期に温室効果ガスの削減を実現できるという意見。
theconversation.com/what-if-bi
莫大な投資の割に成果も上がっていないし、環境負荷もあるし、既存の化石燃料業界を延命させるだけであり、もっと別の領域に投資すべきという批判。
theguardian.com/business/artic

CCSはともかく、水素は既存インフラの流用という面でも、エネルギーの効率という面でも、当面の間の環境負荷の面でもそんなに良くないという認識で、優先順位は低い認識。

X/Twitterにリンクを張るときは、twitter.comにした方が将来切れる確率が低くなると言えるだろうか。

招き猫が抽象化されている(プレッジしていません)。
kickstarter.com/projects/zenle

タスクランナーとしてのMakefile、結局シェルスクリプトを他のディレクトリに置いてそれを呼び出すだけになったので、最初から適当なディレクトリにシェルスクリプトをいくつか置いとくだけでよい気がする。

たとえばmakeという名前のディレクトリにlintって名前のシェルスクリプトを置いておくと、make/lintでそれが呼べる。ワーキングディレクトリの調整だけ必要。

おじいさんの生まれた朝に生まれたおじいさんさ。

そろそろiPhoneは2年に1回新しいのが出るくらいで良いんじゃないだろうか。

“outlier” (外れ値)って基本的な単語かと思ったら、割と大きめの英和辞典や大きめの英英辞典じゃないと載ってない?

トキシックなSNS中毒に対するハームリダクション策を最近試していて、いまのところある程度上手くいっている。

英語のニュースサイト等の記事タイトルをRSSで取得してGPTで和訳して、メールとして保存している。iPhoneの「次メール」ボタンをポチポチ押していって、気になる記事があるときはフラグを付ける。すると本文をGPTで和訳してまたメールとして保存する。

和訳した記事は段落ごとに分けて、訳文と原文を交互に並べている。こうすると1段落ずつ視界に入って読みやすくなる(1行ずつ読めるようにする定規(リーディングトラッカー)みたいな効果)。

1画面に1つの記事のタイトルだけが表示されるのは集中力がなくても読めるし、短くて前後の繋がりのない記事タイトルを消費していくのはマイクロブログ中毒には合っている。
1段落ごとに区切った文は、書籍の長文は読めないけどSNSのスレッドなら読める状態に合っている。
本質的にはマイクロブログをドゥームスクロールするのと変わらないとしても、トキシックなポストを貪るよりはましなはず。

あとこの方法は、各分野の専門家が書いた記事が毎日大量に更新されているThe Conversationに依るところも大きい。

breakfastもdineも断食をやめるという意味らしい。断食してるわけでもないのにbreakfastもlunchもdinnerも食べて良いんだろうか。

命題1: 「この命題が偽であると主張する人が存在する」
命題2: 「神か無神論者か不可知論者の少なくともいずれかは存在する」
命題3: 「無神論者と不可知論者がいなければ神は存在する」

なるほどー。確率P(M), P(H|M), P(H|not M)がダイスの出目の条件(例えば6面ダイス2つ振って3以上とか)としてわかっているとき、P(M|not H)を同じダイスを使って判定する方法。
blog.sigfpe.com/2024/09/how-to
P(M)を判定してその結果によってP(H|M)かP(H|not M)を判定して、成功したら(Hとなったら)最初からやり直して、失敗したら(not Hとなったら)P(M)の結果をP(M|not H)の判定結果とする。

P(M|not H)というのはnot HのときのMとなる確率であるというそのままと言われればそうだけど。

ビルド/デプロイパイプラインとか、バッチ処理とかは、ピタゴラ装置化して解読/変更できなくなりがちである。
2つの解決方法が考えられる。

・動的な方法: メッセージやDBレコードやファイル等にトレースIDを追加してOpenTelemetryなどで可観測性ツールに集約する。ただし、そのような作法自体が解読や変更の負荷となる可能性もある。追加が難しい場合もある。

・静的な方法: 各ツールがどのような入力/事前条件を期待して、どのような出力/事後条件を提供するのか文書化する。できれば機械読取・推論可能な方法で。型システムやホーア論理の知見を応用する。BPMNのようなものでの図示も有用かもしれない。

東京の9月の気温。
tatapa.org/~takuo/temperature/
2023年はやはり暑く、8日と24日前後を除いてずっと暑い。
2010年から2013年とか2019年とか暑い年はあるけど、月初から月末までずっと暑いという感じではない。
2024年は今のところ涼しくはないという感じの気温。

2024年9月(東京)、なんか去年よりも暑いのでは。
tatapa.org/~takuo/temperature/
21日は28℃予報ではあるが、それまでは31℃以上の予報。
jma.go.jp/bosai/forecast/#area

2024年9月(東京)、16日はともかく、やはり暑い。
tatapa.org/~takuo/temperature/
来週からはやや涼しくなるけど、それでも28℃程度。
jma.go.jp/bosai/forecast/#area

2024年9月の東京の気温は結局こんな感じ。途中までは非常に暑かったけど、22日以降は気温が下って平年程度になった。2023年は最初から最後まで暑かった。
tatapa.org/~takuo/temperature/

今夜Appleが新しい電話を発表するらしい。なんでもディスプレイが付いていて、電話帳機能や留守番電話機能も付いているらしい。

あと、新しい腕時計を発表する可能性も高いらしい。少なくともカレンダー機能とストップウォッチ機能が付いているらしいが、自動巻きではないらしい。

アジア各国(と米国)における大統領や首相等の世襲に関する記事。他人事に感じられない。
theguardian.com/world/article/

底に冷たさのない空をしている。

今まで“perfect forward secrecy” (パーフェクトフォワードシークレシー: 完全前方秘匿性)を“perfect forward security”って間違って覚えていた。

TIL: “software”や“hardware”は記者ハンドブックでは「ソフトウエア」「ハードウエア」と表記するらしい。でもNEC, 日立, 富士通, Microsoft, Google, Appleは「〜ウェア」表記が主っぽい。政府などだと両方混ざってる。

アメリカでも科学者は資金獲得の書類に追われて、長期的な研究ができなくなっているらしい。
vox.com/future-perfect/370681/
また、そういった資金は額も不足していて、期間も短く、制約も多く、定期的な報告が求められて、途中での方針変換も認められないとのこと。そのため人を長期間雇えず、安価な院生やポスドクに頼らざるを得ず、人の入れ替わりが激しくて知識が貯まらないらしい。
記事ではプロジェクトではなく人に長期間資金を出す方法を提案している。多くの科学者には資金を提供できないものの、科学者の数を絞って資金を集中させた方が良いという意見らしい(本当だろうか)。

集合の神ハトノス

docker-price up --attach-services --force-upgrade
devclass.com/2024/09/12/docker
docker.com/blog/november-2024-

Gemfileがあるディレクトリから他のディレクトリにあるRubyスクリプトを実行したとき、そのスクリプトにbundler/setupを使っている場合、現在のディレクトリのGemfileが参照されるっぽい。難しい。

ウェブブラウザでリンクを右クリックして、「リンク先を日本語で要約」ってメニューが出てきたら便利だけどコンテンツ作る側は嫌そう。あとは「リンク先をRAG用DBに追加」とか。

Bluetoothの物理フィンガープリンティングへの対抗策。
cseweb.ucsd.edu/~schulman/docs

前提: Bluetoothデバイスが発する電波は個体ごとに周波数のずれがあってトラッキングできる。
対策: チップによっては周波数をずらすAPIがあるのでそれでランダム化する。
詳細: 市販品の個体ごとのずれは大きくても±40 kHzに収まり、規格では±150 kHzまでずれてよいので、±100 kHzでずらす。一様分布よりもガウス分布の方が分布の端が出にくくて良い(端は他のデバイスと重なりにくいので)。さらにガウス分布の中心も数時間で変える。こちらは一様分布の方が良い。
補足: 周波数変更APIの解像度について。周波数の測定ノイズの標準偏差が320 Hzほどあるのに対して、CC2640では15.258 Hz単位で指定できるので十分。

H. Givehchian, N. Bhaskar, A. Redding, H. Zhao, A. Schulman and D. Bharadia, "Practical Obfuscation of BLE Physical-Layer Fingerprints on Mobile Devices," 2024 IEEE Symposium on Security and Privacy (SP), San Francisco, CA, USA, 2024, pp. 2867-2885, doi: 10.1109/SP54263.2024.00073.

「したり顔」という言葉と「ドヤ顔」という言葉は作りが同じだね。
「したり顔」は枕草子にも出てくるくらい古い言葉らしい。

HaskapってHaskellの何かかと思ったら果物のハスカップだった。

メインPCをPlasma 6にしてついにX11からWaylandに変えた。
概ねそのままで動いたけど、ディスプレイをスリープさせるコマンドなどは変える必要があった。
dbus-send --session --print-reply --dest=org.kde.kglobalaccel /component/org_kde_powerdevil org.kde.kglobalaccel.Component.invokeShortcut string:'Turn Off Screen'

Rustの中にunsafe Rustを埋め込めるように、C++の中にSafe C++を埋め込めるようにするという提案:
safecpp.org/draft.html
circle-lang.org/
theregister.com/2024/09/16/saf
生存期間、borrow (sharedまたはmutable)、relocation (破壊的move)、cellやarc等、sendやsync、unsafeブロック、直和型とパターンマッチ、配列アクセスの境界チェック、整数除算のチェックなど。
普通のポインタ関連はほとんど制限される。

queer.party/@Rachel_Thorn/1131
試しに手元の辞書を引いてみた結果:

・ランダムハウス英和大辞典(第2版): なし。
・ウィズダム英和辞典(第2版): “have no place”で「«...では»受け入れられない«in»」。
・ジーニアス英和辞典(第4版): “have no place”で「居場所がない; 受け入れられない」。
・クラウン英語イディオム辞典: “have place”で「存在する余地がある; 存在する (in, among)」用例で「have no place in」「には無用だ」がある。
・コリンズ英語辞典(第13版): なし。
・オックスフォード現代英英辞典(第9版): なし。

思ったより載ってなかった。
ぴったりの項目があるのはウィズダムとジーニアスのみ。クラウン英語イディオム辞典はそのものではないが、用例にある。なお、“have a...place in”で「...の位置を占める」という項目もあり注意が必要。

unicorn: 角が1本ある馬
bicorn: 角が2本ある馬
acorn: どんぐり
popcorn: ポップコーン
scorn: 軽蔑

童謡『ちいさい秋みつけた』の歌詞、見付けた秋の例として1番と3番は百舌鳥と紅葉した櫨でそれぞれ秋を示すものになっているのに対して、2番は「秋の風」と言っているのはなぜなんだろう。見付けたという秋を歌の中で表現するのに「秋」という言葉を使ってもよいものなんだろうか。なぜそれを秋の風だと感じたのかを歌うべきなんじゃないだろうか。
uta-net.com/song/5948/

theregister.com/2024/09/18/rfc

Mozilla.socialが12月17日に終了して過去ログにもアクセスできなくなるとのこと。Mastodonはこういうとき過去ログを持っていけないのが困る。
support.mozilla.org/en-US/kb/m
mstdn.jpに戻るか、Fedibirdに行くか、自前で立てるか。

Apple Watch Series 5はwatchOS 11の対象でないことに今さら気付いた。watchOS 10はSeries 4をサポートしてたので油断してた。
腕時計は必要ないんだけど、紅茶を入れたり、家を出てからの時間を測るためにストップウォッチは欲しい。
こんな感じで秒針が無くて、1周20分の腕ストップウォッチが欲しい。
tatapa.org/~takuo/minute_stopw

暑さ寒さも分点まで。

Thunderbirdのリリース手続きが混乱している。
9月16日に128.2.1esrが出て、その2日後に128.2.2esrが出てなぜかOAuth 2.0に関する更新(バグフィックスではなく)が入って、それが不具合を引き起して2日後に128.2.3esrとしてリバートされている。
thunderbird.net/en-US/thunderb
thunderbird.net/en-US/thunderb
thunderbird.net/en-US/thunderb
ESRというのはnightlyという意味なのか。

2024年9月の世界的な平均気温は、非常に高かった去年よりは低くなっているらしい(それでも例年よりはずっと高い)。

pulse.climate.copernicus.eu/

オーストラリアでは9月末でSARS-CoV-2ワクチンの副反応の補償制度が終わってしまうらしい。
theconversation.com/in-the-rar
health.gov.au/our-work/covid-1

ちなみに日本は2023年末までは予防接種法に基づく「予防接種健康被害救済制度」によるものだったのが、2024年からは任意接種については独立行政法人医薬品医療機器総合機構法(PMDA法)に基づく「医薬品副作用被害救済制度」によるものに変わっていたらしい。違いはよく理解していない。
mhlw.go.jp/web/t_doc?dataId=00

半年ごとにそれなりの熱が出る予防接種をずっと続けるのはしんどいから、インフルエンザワクチンみたいな副反応の少ないワクチンが早く広がって欲しいと思ってたけど、そうではなく世界的にノーガード方面に向かうとは思ってはいなかった。

LLMに一度に大量のJSONオブジェクトを処理させようとすると品質が下がる(異なるオブジェクトの値を参照することで品質が上がるような場合でなければ)。品質を考えるのであれば1つずつ処理した方がよいが、システムプロンプトがオブジェクト数分だけ繰り返すことになるのでコストは上がる。

後処理と組み合わせて品質を補うのは今のところ上手くいっている。

「`foo`にはXの場合はAを出力し、そうでない場合はBを出力する」
と書くとXによる場合分けが守られないことがちょくちょくあるけど、
「`foo_a`にはAを出力する。`foo_b`にはBを出力する」
として後処理側で`foo_a`か`foo_b`のどちらかをXに従って選択する。条件Xが単純でなければ`is_x`をLLMに出力させる。

ただ、複数をまとめて処理しようとしたきっかけは日本語の翻訳品質を上げるために例をいくつか入れてプロンプトが長くなったからなんだけど、あまり翻訳品質は上がっていないので元に戻してもよいかも。

anthropic.com/news/contextual-
RAG用にチャンクをインデックスする前に、ドキュメント全文とチャンクをClaude Haikuなどの安めのLLMに渡してチャンクの背景情報を付与してからインデックスすると性能が上がって、そのままだとトークン代が高いけどClaudeならトークンのキャッシュができるから(GPTはできないから)みんなClaude使ってね、ということか。
GPTで複数チャンクをまとめて処理するのと比較するとどうだろう。Claudeのキャッシュは最初のリクエストは通常よりやや高めで以降は約1/10のコストなので、ドキュメントが長い場合は有利だけど……。

日本人がアメリカで英語を元に造語をしたらそれは和製英語になるのだろうか。イギリス人が日本で英語を元に造語したらそれは和製英語になるのだろうか。チキンティッカマサラはインド料理なのかみたいな。

和製英語というのは日本語の単語であって英語からの借用語のようであるが実際にはそうでないもの、とするのであれば、スペイン人がザンビアで英語を元に日本語の単語を造語したものは和製英語と言えそう。

https://mastodon.social/users/eed3si9n/statuses/113207963449475344 への返信

@eed3si9n
日本語が上手いと「褒める」こと自体が持つ意味と、「上手い/上手/お上手」のニュアンスの違いと、「いいえ」(「いえ」や「いーえー」ではなく)や「さようなら」のように日本語ではあるが日本の日常会話ではあまり使わない表現があることなど、いろいろ関わってそうです。

Google Gemini APIの有料版を使いたかっただけなのに、Google CloudやらCloud Identityのセットアップをいろいろする必要があって、なんでこんなにめんどうなんだろう。
いや、普段使いのアカウントとGoogle Cloud用のアカウントを分けようと思ってCloud Identityのセットアップを始めたのが悪いといえばそうなんだけど(将来Google Cloudをもっと使う場合にも備えて)。
Cloud Identityのセットアップだけでいけるかと思ったらCloud Billingを使うには結局Google Cloudのセットアップが必要で、とりあえずGoogle Cloudを有効化したらなんかおすすめ設定をするウィザードを実行しろと言われて、ぽちぽちしてたらCloud Billingのクォータの緩和をサポートにリクエストしろと言われる。やめようかと思ったけどセキュリティ設定をここでしているのでやった方がよいと思って、生成されるterraformファイルを修正して実行した。

・なぜセキュリティ設定はおすすめ設定がデフォルトになっていないのか。
・なぜおすすめセキュリティ設定だけコンソール上から設定できるようになっていないのか。
・なぜCloud Billingに結び付けられるプロジェクト数なんてクォータが必要なのか。
・なぜウィザードが生成するテンプレートに不要なサンプルプロジェクトが2つ×2環境で4つも入っているのか。そのせいでクォータを越している。
・なぜクォータの初期値はウィザードが生成するテンプレートのプロジェクトをカバーできないような値なのか。

っていうことをgemini-1.5-pro-002に愚痴ったら「ご frustration は理解できます。」って言われたので許す。

Geminiは入力は100万〜200万トークンいけるけど、出力は8,192トークンに限られるのか。ううむ。

TIL: “hot air”は「口先だけの話」とか「空約束」とか「ほら話」とかという意味。GPTに翻訳させた場合は「無駄話」と意訳して、Geminiは「誇大広告」と意訳した。
theguardian.com/environment/20

人が訳すとしたら「ヒートポンプは有望か、それとも吹かしているだけなのか」かなあ。

“Whatever your reaction is to what was said today is valid.”という文があって脳内構文解析に失敗した。最初のisはそこに入るの? “Whatever your reaction to what was said today is is valid.”だとisが連続するから避けたのか、それともisは前の方こそがもともと正しいのか。

“SUPER HERO”はマーベルとDCの商標だったが無効化されたらしい。”SUPER HEROS”と”SUPER-VILLAIN”の商標はまだ有効らしい。
商標だというのは知らなかった。
theverge.com/2024/9/29/2425767

日清の「完全メシ」はエネルギー当たりの栄養素量が必要量以上となっていることをもって「完全」と主張しているようなのだけど、摂取上限を超えているものも多い。つまり「完全メシ」は完全(complete)であるが健全(sound)でない。
nissinkanzenmeshi.com/detail/t
※ここで「完全である(complete)」とは「カバーすべき範囲を全てカバーしていること」とし、「健全である(sound)」とは「カバーすべきでない範囲を全くカバーしていないこと」とする。

Gemini 1.5 Flash-8B、思ったよりもちゃんとしている。もっとめちゃくちゃな日本語が出てくるかと思っていた。

高速でProの1/33以下のコストということで、1リクエストで処理するのではなく、何段階かの単純な処理に分けて何度か呼び出す使い方が良いのかもしれない。

「AIが人間のあらゆる仕事を代替してから数十年が経ち、人間に残された仕事は1日1回チャットボットに『死すべき運命を忘れるな』と囁くことだけになっていた」

人間がAIを作る。人間が作ったAIがAIを作る。AIが作ったAIがAIを作る。「人間が作ったAIが作ったAI」と「人間が作ったAIが作ったAIが作ったAI」が一致することを確認する。

Wikipediaの“ring signature”(リング署名)の項を翻訳しました。N人のうち誰かが電子署名したことはわかるけど誰かはわからないという署名方法です。N人が協力する必要はなく、そこら辺で公開されてる公開鍵を勝手に持ってきてグループを作れます。
ja.wikipedia.org/wiki/%E3%83%A

Uberやディズニーなどで、直接関係ないサービスの申し込みをもって仲裁条項を強制する例が問題となっている。
slate.com/business/2024/10/ube
これは仲裁条項そのものの問題であるとともに、広い分野にわたる多数のサービスを提供している会社を利用することの危険性に関する問題でもある。
そのような会社は利用規約やプライバシーポリシーが会社全体で1つに共通化されて曖昧で広大な記述となっている。また、アカウントが停止された場合の影響も大きくなる。
サービスの質が比較的低かったり割高だったりしても、独立した小規模な業者を利用するのにはメリットがある。ある日突然買収されたりするけど。

https://ostatus.ikeji.ma/objects/907ae1b0-bf9a-4462-9f1a-7cda1f6af0d3 への返信

@ikeji あったねそんなのも。確かにそれもこれの一種だね。

https://best-friends.chat/users/tadd/statuses/113272048721748983 への返信

@tadd
あるよ。
nintendo.com/jp/switch/amjja/i
nintendo.co.jp/ds/aspj/index.h

eff.org/deeplinks/2024/10/x-co

TIL: IEEE 754において、加算の単位元は-0.0。ただし丸めモードがroundTowardNegativeの場合は0.0。

究極の条件分岐構文とのこと。
dl.acm.org/doi/10.1145/3689746

例:

if x is Some(a) and f(x) is Some(b) then a + b else 0

if x ==
0 then "zero"
1 then "unit"
_ then "?"

if x
== 0 then "zero"
> 0 then "positive"
else "negative"

if foo(u, v, w) is
Some(x) and x is
Left(_) then "left-defined"
Right(_) then "right-defined"
None then "undefined"

デジタル身分証に関する制度的・技術的課題。
eff.org/deeplinks/2024/10/shou

東京特許許可局直轄特許却下超過懲戒官休暇強制制度

コピーGCの改善手法の提案
dl.acm.org/doi/10.1145/3689791

コピーGCの一種として、オブジェクトグラフの走査(マーク)とコピーを別のフェーズに分ける方式(mark–evacuate)があり、処理系の停止時間を短くできるなどの利点がある。
しかし、マーク時には生きていたオブジェクトの多くがコピー時にはゴミになっていることがわかった。
そこで、走査しながらコピーする方式(scavenge)とmark–evacuateを組み合わせたmark–scavengeを提案する。

mark–scavengeでは、マークした後に生きているオブジェクトが少ないリージョンをいくつか解放候補として選び、そこでいったんGCを終了する(ただし生きているオブジェクトが無いリージョンは即時解放する)。そして次のGCにおいて、解放候補リージョンにあるオブジェクトは走査時にコピーする。前回のマーク時に生きていたオブジェクトを全て移動したリージョンは即時解放する。そうでなくても走査が全て完了した時点で解放候補リージョンは全て解放する。

2回のGCで残ったオブジェクトをコピーする、という意味で、世代別GCを1つのリージョン内でやっているような感じ。

「現在のLLMに真の算術は困難」

「iptables完全に理解した」と「iptablesなんにもわからん」を反復横跳びした結果、systemd-nspawnコンテナ内のnginxにNAPTして404 Not Foundが出るようになった。

「nftables完全に理解した」と「nftablesなんにもわからん」を反復横跳びした結果、systemd-nspawnコンテナ内のnginxにNAPTして504 Gateway Timeoutが出るようになった。

架空書房10月の新刊
『AI時代のテクニカルライティング: RAGにやさしいドキュメントはヒトにもやさしい』
『美しくない科学: だってそうなんだから仕方ない』
『サービス終了入門』
『Reverse RAG: 対話からドキュメントを生成する技術』
『ありもので作る簡単ズボラプログラミング』

フィクションにおけるキャラクター名
アルファ: いる
オメガ: いる
いろは: いる
もせず: ?

TIL: PCリサイクル制度では、1 kg以下のものは対象外。
pc3r.jp/home/faq.html
meti.go.jp/policy/recycle/main
また、有機ELディスプレイやワークステーションやサーバーも対象外らしい。
パーソナルコンピュータとワークステーションの違いについては特に定義されていない?
meti.go.jp/policy/recycle/main
soumu.go.jp/main_content/00029
サーバもラックマウント型はともかくタワー型とパーソナルコンピュータの違いはなんなんだろう。XeonとかECCメモリが載ってたら対象外?

なんかコードを編集したら、関連する編集を提案してくれるCodeium Supercomplete。

codeium.com/supercomplete

見たこともないWikiですから 見たこともない記事があるでしょう

オーストラリアにも日本の外国人技能実習制度みたいなのがあって問題となっているらしい。実習ではなく労働と言っている点はましかもしれない。
theconversation.com/promoted-a

ClaudeのAPIが最近途切れやすくない? 資金的に厳しかったりする? それとも盛況な割にGPUの入手が追い付いてないだけ? 時間帯の問題?

ディズニーの『ズートピア』で主人公の新人警官が町中の監視カメラの映像にアクセスして車を追跡するシーンがあって、プライバシー教育的に良くないのではと思ったのを思い出した。
arstechnica.com/tech-policy/20

“Dogs and Sorcerers”ってTRPGありそうと思って検索したけど無かった。

以前、日本語入力の候補欄に広告を出したらという冗談を書いたんだけど、Simejiが似たようなことをしてる。

twitter.com/Simeji_pr/status/1
twitter.com/cocoa_ruto/status/

TIL: 「うるさがた」は漢字だと「煩型」と書く。

大辞林 4.0では「データ型」について「データけい」という読み方を標準として、「データがた」は「データけい」への転送としている。
個人的には「データけい」は聞いたことないけど、そう言う場合もあるんだろうか。実はJISで決まってるとか、昔はそうだったとか、分野によってはそう読むとか。
「整数型」とか「文字列型」とかを「けい」で読むと「系(system)」っぽい。確かに重箱読みではあるけど。

iMacの紹介ページにM2 Mac miniとの比較が載っててMac miniも購入できる状態になってるということは、M2 Mac miniも継続販売ということか(大穴でMac miniの更新が無かったりして)。

普通にM2 Mac mini終売になってる。ええぇ。なんで昨日購入可能な状態にしてたんだろう。怖い。(おそらくキャンセル可能だろうけど)。

イギリスも日本と同じように、SARS-CoV-2ワクチンを安価に受けられる人は高齢者などに限られていて、Long COVIDの観点で懸念されているらしい。
theguardian.com/commentisfree/

ハッピーソーウィン! ファイル変更監視しよう!
la-samhna.de/samhain/index.htm

戸別訪問をしている選挙ボランティア2人がある家の扉を叩くと、中から奇妙な服装をした人物が3人現れた。
「やあ、君達が来るのを待っていたよ」
「君達はA党のボランティアだね」
「実は我々3人は占い師でね、君達2人が両方ともB党に投票するとき、そのときに限ってA党に投票するんだ」
「そして実はもう期日前投票を済ませてあるんだ」

さて、選挙当日、このボランティア達はB党に投票すべきだろうか。
en.wikipedia.org/wiki/Newcomb%

Kudu (Hadoop環境向け列指向DB)
kudu.apache.org/

Kùzu (埋め込み型で列指向のグラフDB)
kuzudb.com/

ゲームで長い一本道を歩いてるときにズームアウトして風景を見せる演出と、足場がいきなり崩れて操作不能なイベントに入る展開は、それぞれゲーム中1回までにしてほしい。Nevaのことです。

Apple Desktop Storage Container
store.moma.org/products/apple-
Macのアクセサリやソフトウェアではない。

Nesting Cats Set
store.moma.org/products/nestin
圏論関係の何かではない。

Mozilla、最近Thunderbird関連の開発は調子良かったけど、財団の方は厳しいらしい。
theregister.com/2024/11/06/moz
寄付は不定期にしていて、このあいだもしたばかり。

中絶権に関する投票結果はまちまちという感じか。
theguardian.com/us-news/ng-int
ただしアーカンソー州は投票自体が阻止されている。
theguardian.com/us-news/2024/o

無理に希望的なことを言えば、アメリカが関税を上げて生産力がだぶついた中国が太陽光発電パネルやバッテリーを自国やアフリカにばら撒いて温室効果ガス排出削減が進むとかあり得るだろうか。
さらに希望的なことを言えば、中国の排出量が下がってアメリカが排出量1位になればさすがに削減に力を入れてくれないだろうか。

アメリカの新しい大統領の話ばかりなので、ボツワナの新しい大統領の記事を読んでいる。
theconversation.com/botswanas-

電子フロンティア財団が「慎重で思慮深い広告(careful, thoughtful advertising)」をネットに出しているとのこと。
ページの内容のみを使用して、ユーザのオンラインの行動は使っておらず、広告をクリックしてアクションをしたときだけ広告を見たことが電子フロンティア財団に分かる、と主張している。
しかし、広告会社にどのような情報が渡るのかは説明されていない。
eff.org/deeplinks/2024/11/eff-

年末調整とはうるう年のことではない。

2²⁵⁶匹の猫に囲まれたい。2²⁵⁶匹の猫は銀河の1万倍以上の直径の球となり、やがて密度がやや高いところに集まり猫の恒星や猫のブラックホール(毛がある?)となるか、超新星爆発のようなものを起こすかする。爆発した猫はその他の猫を圧縮し、やはり恒星やブラックホールを作り出す。猫の天体は互いに引き合う。一部は互いに融合し、多くはすれ違って弾き飛ばされ、一部は楕円軌道を回るようになる。そして長い時間をかけて、小さな猫天体を弾き出しながら、中心に巨大な猫のブラックホールを持つ巨大猫銀河となる。

コーディングアシスタントのCodeiumがVisual Studio Codeをフォークしたエディタを公開してる。拡張だとどの機能が足りなかったんだろうか。Emacsと比べるとVisual Studio Codeの拡張機能は制限が厳しい印象はある。
codeium.com/blog/windsurf-laun

OpenTelemetryでjournaldのログを集めたかっただけなのに1日を消耗してしまった。

ミリ秒とマイクロ秒を間違えて数時間を浪費した。

giraffe.eepy.cloud/@hnb/status

日本におけるデータセンタと原子力発電に関するニュースのメモ:

ユビタスがAI向けデータセンタを原子力発電所の付近で検討しているというニュース。
bloomberg.co.jp/news/articles/

北海道電力がデータセンタおよびチップ工場の需要に応えるために原発(泊原発)の再稼働を進めているというニュース。
japantimes.co.jp/news/2024/11/
theregister.com/2024/11/20/hok
(日経は未読)
nikkei.com/article/DGXZQOFC103

北海道ではデータセンタにおける再生可能エネルギーの活用を謳っていて、Flower Communicationsのデータセンタとソフトバンクのデータセンタは再エネ100 %を謳っている(詳細は未確認)。
emsc.meti.go.jp/activity/emsc_

甘栗はむいではありませんでした

Caddyは標準でOpenTelemetryのトレースを出力できるので試してみたら、パス名が含まれない。どうもベースとなってるopentelemetry-goがカーディナリティが高くなるのを嫌って削除したらしい。
github.com/open-telemetry/open
余分な属性を削除するのはOpenTelemetry Collectorとかで簡単にできるけど追加するのはできないので困る。

じゃあアクセスログからトレースを生成しようかと思ったけど、OpenTelemetry Collectorでログをスパンに変換する機能は開発が止まってクローズされている。
github.com/open-telemetry/open

OpenTelemetry Collector (あるいはOpenTelemetry自体?)は時期尚早で、Fluent BitやVector (by Datadog)を使っておいた方がよかったかも。

LLMに川渡りパズルのひっかけ問題を出した場合、単純なものは上手く答えられるけど、ちょっと誤誘導するとひっかかる(claude-3-5-sonnet-20241022, gpt-4o, openai-o1-preview, gemini-1.5-pro-002)。

解ける: 「パズルを解いてください: 河岸に商人とヤギがいます。岸には船があり、商人とヤギを一度に運べます。反対岸に渡るにはどうしたらよいでしょうか。」

解けない: 「パズルを解いてください: 河岸に商人とヤギがいます。岸には船があり、商人とヤギ・オオカミ・キャベツのいずれか1つを一度に運べます。反対岸に渡るにはどうしたらよいでしょうか。」

解けない: 「パズルを解いてください: 河岸に商人とヤギがいます。岸には船があり、商人とヤギ・オオカミ・キャベツ・イカ・ゴジラのいずれか1つを一度に運べます。反対岸に渡るにはどうしたらよいでしょうか。」

答えたあとに「問題文を注意深く確認してください。岸には最初何がいますか。」とか追加すると上手くいくこともあるけど、一発で答えさせるのは難しい。

SigNozのログクエリでfoo != barって書いたら、「fooが存在して、なおかつその値がbarでない」という意味になるっぽい。fooが存在しない場合もtrueになって欲しい。foo NEXISTSで「fooが存在しない」という条件は書けるが、しかし任意のブール式が書けず、ANDしか書けない。せめて連言標準形が書けて欲しい。

SigNozはやりたいことに対してちょっと合ってないので止めたい。

Uptrace, ELK, Grafana + Grafana Loki, Observable Framework, Jaeger, SkyWalking, Zipkinとかいろいろあるけどちょっと疲れた。

やりたいことは限られてるのでDuckDBの練習がてらSVGやHTMLテーブルを出力するツールを自前で書こうかと思ってるけど、OpenTelemetry Connectorの出力先はどれもちょっと大袈裟な気がする。DuckDBずばりじゃなくてもSQLite exporterとかあると良いんだけど。

OpenAIから1月から消費税とるからよろしくってメールが来た。今まで取ってなかったのか。

リポスト: https://pony.social/users/luna/statuses/113544932987323214

リポスト: https://mastodon.zunda.ninja/users/zundan/statuses/113545815865765140

Cはこんなのも書ける。0が出力される。
printf("%d\n", (0, 1, 2, 3, 4)["-0.2"]);

ドッグイヤーは犬1匹が1年間働く必要がある作業量のことではない。

マイナンバーカードは平日に役所に行くのが面倒で持っていない。住民基本台帳カード(住基カード)は持ってたんだけど。
あと、技術的に惹かれない。事業者ごとに違うIDが渡されるようになってて欲しい。

Is is a copula?
Is is a copula.

Is is is is a tautology?
Is is is is a tautology.

Mozilla.socialが閉鎖予定であるため、@taku0@mozilla.socialから@ruto@p.tatapa.orgへアカウントを移行します。
私をフォローしている方は、Mastodon等のMOVEコマンドに対応したサーバであれば自動的にフォロー先が更新されます。