2024/1/1-1/10 AI 新知

語言

TinyLlama: An Open-Source Small Language Model [論文] [開源] 用大資料集訓練 1.1B 小模型之成果

Improving Text Embeddings with Large Language Models [論文] 使用 LLM 生成合成資料集，訓練更好的 Text Embedding (用作 RAG 之類任務)

Task Contamination: Language Models May Not Be Few-Shot Anymore [論文] LLM 在訓練截止日期之前及之後的能力相差很大，代表數據污染問題嚴重 (我推測很多新模型號稱勝過舊模型，因為都有拿更新的訓練集做訓練，其實並未真正勝過舊的)

AnyText AI: FREE Revolutionize Your Images with AI-Powered Text Editing 可指定位置、變形、多語言、控制樣式等方式生成良好文字圖片

Comflowy Introduction ComfyUI AI 繪圖環境的教學

OpenVoice [開源] 即時複製多國語音，控制情緒、口音等

Fast inference engine | Nitro 本機執行 3MB 小程式，支援跨平台/CPU/GPU/多模態(即將支援) 等推理功能

Auto Wiki by Mutable.ai 已將熱門 GitHub 儲存庫以 AI 撰寫摘要整理及程式文件，其他儲存庫也可請求加入

Mobile ALOHA 史丹佛大學的機器人，有看到人操控示範，也有自主運作。但看到它在家運作的影片，都沒看到後面，我在猜是有人操控的狀態!? 因為動作真的做得非常細膩

Efficient LLM inference 要降低推理成本，此文說首先要優化程式，若有資源就蒸餾，沒有再用量化

Chess-GPT's Internal World Model [開源] 重頭訓練玩西洋棋模型，不告知規則也不給予狀態，單單要求預測下一個字元，模型就能學會規則，計算狀態，甚至包括預測對方棋力的能力。另每場遊戲都不與訓練集重覆，故作者認為這不是由於記住訓練集所得的能力

OpenAI and journalism OpenAI 對紐約時報控告的反擊，說是利用多年廣泛流傳的文章，刻意寫冗長摘要的提示，刻意操控模型要它吐出文章；另說可退出訓練 (但我認為這點站不住腳，退出只是不讓機器人爬現在的網站，但先前已在訓練集的內容仍無法去除，現有模型的知識也無法修改)

The Four Wars of the AI Stack (Dec 2023 Recap) 談到四種 AI 戰爭 (資料來源、GPU 富者/窮者、多模態、向量資料庫/RAG/Ops)，還有 AI 推理價格戰

Attacks on machine learning models 整理出多種攻擊各類型 AI 模型的方法

Thousands of AI Authors on the Future of AI 大規模調查 AI 研究人員對未來 AI 進展速度的看法