10/20-31 AI 新知

ChatGPT Plus 更新了！可上傳 PDF 等多種檔案，且不必手動挑選模型 / Alex Ker 🔭 on X 我自己的 Plus 還沒看到這功能..

Odd One Out — Google Arts & Culture 限時在四張圖片中指出哪張是 AI 生成...蠻困難的，基本上就是亂猜，即使不限時也看不出來，一下就死了...

My annual letter: Leading in a new era 微軟執行長公開信

對 AI 的大力投資，再度鞏固了微軟的雲端地位 Azure 營收已超過 AWS 啦!? 不曉得市占率如何?

Gemini is coming to Makersuite & so are Stubbs Google 下一代 AI 的洩露資訊

Anthropic \ Collective Constitutional AI: Aligning a Language Model 公民提供 AI 憲法意見，有些一致有些不一致 (如「AI 是否應該要有情感」)

Introducing Video-To-Text and Pegasus-1 (80B) 以視訊優先方式 (而不是逐個圖片或僅音訊/字幕) 訓練而得的由影片生成文字模型，可多模式理解 (視覺、語音、聽覺)，可分段/摘要/詢問問題，看來也有蠻完整的 UI/API 可用

DreamCraft3D: Hierarchical 3D Generation with Bootstrapped Diffusion Prior 一張照片生 3D 模型，成果看來已經離完美不遠了...再來就差要動起來!

NEWTON: Are Language Models Capable of Physical Reasoning LLM 是否理解物理世界? 這是一個評估集

You (Kind of) Don't Need RAG - ChatGPT Finetuning Technique 建議用微調而不是 RAG (搜尋附加再生成)

GitHub - junhoyeo/BetterOCR 結合多個 OCR 再輔以 LLM 修正的文字辨識，還可加上自訂上下文提示主題方向

Embarrassingly Simple Text Watermarks 透過替換 Unicode 外觀相近字元，簡單地實現可識別 AI 文字的方法

What Every Developer Should Know About GPU Computing 更詳細了解 GPU 內部運作原理 (CPU 是更快的循序執行，GPU 是更快的平行執行)

How confidential computing and AI fit together nVidia 新 GPU 內建機密運算用的私鑰，然後看不懂...用途包括將機密 AI 任務丟上雲端、私有模型下載 (但不洩露權重?)，也可讓公有 AI 服務提供者不可能取得個人上傳資料(!?)

打破 AI 模型記憶體極限！Google 研究人員找到餵給 AI 超大量數據的新方法

環形注意力能夠降低 Transformer 的記憶體需求，能夠訓練比先前最先進的記憶體長 500 倍以上的序列

Eureka | Human-Level Reward Design via Coding Large Language Models 以 LLM 逐步不斷修正獎勵函數，達成自我學習不斷進步的目標，可以超越人類專家寫的獎勵函數

Human-like systematic generalization through a meta-learning neural network 以不存在的單字，讓機器學習人類的泛化能力。以下這個學習任務的規則你看得懂嗎? 我花了些時間把這個圖全部看懂了...只給少數幾個範例，就要學習泛化類推...

Thanks to AI, the future of programming may involve YELLING IN ALL CAPS 現在得要用全大寫字母來要求 AI 遵循指令...另，對 AI 說請/謝謝應該有助於得到更高水準的答案...

我曾經有一個個人政策，永遠不會對模型說“請”或“謝謝”，因為我認為這是不必要的，甚至可能是潛在有害的擬人化。但我改變了主意，因為在訓練數據中，我想像有很多例子表明，禮貌的談話比不禮貌的談話更有建設性和有用。

The Wait Equation and AI Investment 與其現在趕快開始開發，不如等待 AI 能力趕上後，再一舉超越!? 這讓我想到，好像兩三年前(?)有看到為了即將失去聲音的 (漸凍?) 人收集聲音的努力，要錄好幾小時(?)的聲音，才能訓練 AI 來複製聲音。但現在的複製技術已經可以在幾秒鐘到幾分鐘的音檔達成了...

基本想法是，等待方程式評估是利用現有技術立即啟動星際任務更有利，還是推遲直到進步實現更快的旅行，從而有可能將長達幾個世紀的旅程縮短為短短幾十年。

Strange Ways AI Disrupts Business Models, What’s Next For Creativity & Marketing, Some Provocative Data

依時間計費之服務如律師、設計師等，因為 AI 加速使得所需時間也大幅縮短，過往的商業模式需要大幅變更，如何提供更高的價值或體驗?
當人們更多相信 AI 的推薦，原本靠關係而維繫的買賣可能會轉變
原創的娛樂內容更重要，因為二創變得太輕鬆容易

The Best Available Human Standard 你能 (免費) 接觸到的 AI，比你能接觸到最有能力 (而且願意幫助你) 的人還要好嗎? 裡面例子有最佳共同創辦人與教練。又好比雖然醫生一定比 AI 可靠，但你能花多少錢，買醫生多少時間，為你個人的需求來詳細解釋/提供建議?

在特定時刻、特定地點，可用的最佳人工智慧是否會比在特定情況下實際能夠提供幫助的最佳可用人類更好地解決問題？

Generative AI like Midjourney creates images full of stereotypes - Rest of World AI 對世界各國的偏見，比如中國女人就都穿紅色旗袍，美國人則都帶著國旗