摸鱼集市
OpenAI 这波有点厉害呀。我看了一下,即便是 120B 在 MoE 的架构下同时激活的参数也只有 5.1B 还能做到近似 O3 的水平??? 这个 20B 虽然看着多但是实际上同时只激活 3.6B,这个端侧可玩性太强了 那 Kimi K2 这种上 T 级别的模型岂不是算是浪费算力,期待一波国内模型推理提供商全面转向 gpt-oss
https://cdn.openai.com/pdf/419b6906-9da6-406c-a19d-1bb078ac7637/oai_gpt-oss_model_card.pdf
看了一下 HN 上发的简单的技术报告,感觉自己和自己比的话有点玄乎呀,可以渲染一个和其他模型的对比图对比一下看看
看了一下 HN 上发的简单的技术报告,感觉自己和自己比的话有点玄乎呀,可以渲染一个和其他模型的对比图对比一下看看
August 6, 2025
August 8, 2025
August 9, 2025
Forwarded from 52N 型行动日志 (柠喵² LemonNeko⁴)
This media is not supported in your browser
VIEW IN TELEGRAM
给 AIRI Factorio 小模型做了个 Playground
欢迎来玩:https://huggingface.co/spaces/proj-airi/factorio-yolo-v0-playground
欢迎来玩:https://huggingface.co/spaces/proj-airi/factorio-yolo-v0-playground
1👍3❤1
August 16, 2025
August 18, 2025
今天收到了一个 PR,把我在 @daocloud_io 和团队成员一起搞的 KubeCon 演讲 slide 改了个名字和 title 然后 PR 直接交到我们这里 🤮
https://github.com/BaizeAI/talks/pull/15
和先前 Dify 那个事情如出一辙...
虽说我们 Apache License,但直接提 PR 提到脸上感觉还是太夸张了...
https://github.com/BaizeAI/talks/pull/15
和先前 Dify 那个事情如出一辙...
虽说我们 Apache License,但直接提 PR 提到脸上感觉还是太夸张了...
1🤮16🤣7
August 18, 2025
https://airi.moeru.ai/docs/en/docs/overview/guide/tamagotchi/
PS: 如果有谁愿意帮忙翻译一下中文版本的文档就更好啦!
🥰9❤1
August 21, 2025
August 25, 2025
参与制作的测评 MCP 的 benchmark 终于发了 🎉
https://mcpmark.ai/leaderboard
我编写了比较复杂的有关 Supabase 常用的 Row level Security,数据库安全审计,DBA 分析向量数据库 task
也基本跑通了 Kubernetes 的流程,如果模型厂商也会喜欢我们的工作的话,也会集成进去的
比较意外的是:OpenAI 的 GPT-5 断层领先
https://mcpmark.ai/leaderboard
我编写了比较复杂的有关 Supabase 常用的 Row level Security,数据库安全审计,DBA 分析向量数据库 task
也基本跑通了 Kubernetes 的流程,如果模型厂商也会喜欢我们的工作的话,也会集成进去的
比较意外的是:OpenAI 的 GPT-5 断层领先
1👏6👍2👀2
August 26, 2025
摸鱼集市
参与制作的测评 MCP 的 benchmark 终于发了 🎉 https://mcpmark.ai/leaderboard 我编写了比较复杂的有关 Supabase 常用的 Row level Security,数据库安全审计,DBA 分析向量数据库 task 也基本跑通了 Kubernetes 的流程,如果模型厂商也会喜欢我们的工作的话,也会集成进去的 比较意外的是:OpenAI 的 GPT-5 断层领先
GPT-5 的这个单次均通过率在 46.96% 上
细节分析:大家常用的 Claude 是相对于 GPT-5 弱势的存在,Gemini 实际上也没有特别优秀,甚至不如 DeepSeek V3.1
在大家关心的 vibe coding 这件事情上:如果不考虑 GPT-5 会需要额外验证 OpenAI 组织才能访问的前提,GPT-5 实际上成本会优于 Claude 4.1 很多,最大的缺点可能就是慢了
有趣小故事:我写的有一个 task GPT-5 尝试交互了 MCP 43 轮才完成 😂 感觉是比较意外了
PS:具体的数值大家可以到 https://mcpmark.ai/leaderboard 参看
细节分析:大家常用的 Claude 是相对于 GPT-5 弱势的存在,Gemini 实际上也没有特别优秀,甚至不如 DeepSeek V3.1
在大家关心的 vibe coding 这件事情上:如果不考虑 GPT-5 会需要额外验证 OpenAI 组织才能访问的前提,GPT-5 实际上成本会优于 Claude 4.1 很多,最大的缺点可能就是慢了
有趣小故事:我写的有一个 task GPT-5 尝试交互了 MCP 43 轮才完成 😂 感觉是比较意外了
PS:具体的数值大家可以到 https://mcpmark.ai/leaderboard 参看
🤔3
August 26, 2025
摸鱼集市
GPT-5 的这个单次均通过率在 46.96% 上 细节分析:大家常用的 Claude 是相对于 GPT-5 弱势的存在,Gemini 实际上也没有特别优秀,甚至不如 DeepSeek V3.1 在大家关心的 vibe coding 这件事情上:如果不考虑 GPT-5 会需要额外验证 OpenAI 组织才能访问的前提,GPT-5 实际上成本会优于 Claude 4.1 很多,最大的缺点可能就是慢了 有趣小故事:我写的有一个 task GPT-5 尝试交互了 MCP 43 轮才完成 😂 感觉是比较意外了…
这次的 MCPMark 是完全开源的,如果你觉得我们写的 task 和框架不好也请在这里给我们提交贡献 https://github.com/eval-sys/mcpmark
个人觉得是非常幸运可以和 NUS(新加坡国立大学)的大家一起合作的,希望也可以继续能有这样的学术合作的机会 ❤️,大家如果有 research 需要帮忙的也请联系!
我们 LobeHub 给帮忙设计的界面也依然是一流水准,一定要去看看呀 ➡️ https://mcpmark.ai
个人觉得是非常幸运可以和 NUS(新加坡国立大学)的大家一起合作的,希望也可以继续能有这样的学术合作的机会 ❤️,大家如果有 research 需要帮忙的也请联系!
❤3👍2🥰1
August 26, 2025
September 3, 2025
Media is too big
VIEW IN TELEGRAM
用 AI 玩小丑牌(?
虽然这一轮玩得毫无道理啊但是 it works
以及,now open sourced!
https://github.com/proj-airi/game-playing-ai-balatro
虽然这一轮玩得毫无道理啊但是 it works
以及,now open sourced!
https://github.com/proj-airi/game-playing-ai-balatro
😭5🔥2🥰2👎1
October 9, 2025
October 11, 2025
摸鱼集市 via @antibvbot
https://www.bilibili.com/video/av115334099049470
即便这和自己所在行业已经有部分重合(不过我确实没有做 AIGC 相关的事情),我认为这种目前由人类驱动的 AIGC(也就是 Kurzgesagt 这期视频提到的 AI Slop,AI 垃圾),在未来可能会有更深远的影响。。。
现在大家只是看到有创作者用 AI 工具批量生成内容赚取流量来钻赚钱的空子,那如果这个过程变得更自动化了呢?比如,全自动地调用 ComfyUI 和 Sora 生成更多的垃圾视频填充到时间线上。国庆期间大家很欢呼和喜好的 Sora 这样的 App,本质就是一个彻底 AIGC 驱动的 Tiktok(or 抖音),在剥夺注意力资源之外,也在视频(这个本身就缺乏数据集)的模态上上产生更多的垃圾数据。
我知道有其他的公司和企业正在开发完全由 Agent(根据历史的 chat history 和形成的 memory)去精确地通过你交给 AI 的对话数据判定用户画像,然后生成专属于用户和用户确实会喜欢的 feed 推荐流,实现真正意义上的 agent driven Tiktok(这样的东西没有实质上的技术难题或者工程上做不到的事情,只要能负担得起分析 agent 的成本就可以做到),我理解投资行业对于寻找到下一个 AI 时代的 Tiktok 的欲望非常强,但这对人类文明来说是好不负责任的,不正确的发展方向。
就算是我工作范围内的 RAG 和 知识召回、memory 这件事情上,现在也已经遇到了超级多的正确性和召回后的信息有价值与否的难题了,而且这似乎是无法被量化和可被评估的数据(因为 fact check 真的是非常费力的事情,也有前两天的论文介绍了 small segment of information can pollute how ai searches(在 bilibili 上也有别的博主制作过类似的视频介绍类似的实验))。现有的若干 Deep Search 在 可信信息 的算法上也依然是用工程或者 reranker 来实现的排序,总是会有漏洞,也并不会在语义上和事实上对信息进行 fact check,最多也就是进行多个信源的处理实现交叉检查。
那如果我们看看「数据就是 AI 的石油」这样的 Ilya 也说过的话呢?难到这些 AIGC 就没有任何意义吗?有一部分意义,在 LLM training 和 post-traing 上,synthetic data(合成数据)是非常重要的部分,实际上对于具身智能也是如此,洗数据是非常困难的事情,data 是 somehow 的劳动密集型行业,现在可以堆人,未来呢?如果互联网上都充斥的是垃圾数据呢?也许未来某天,无法采用互联网数据的时候,就必须要有专门的行业专家 / 专家模型在特定领域生成数据才行了。。。
哦对,在减少工作量和提供更多岗位上,AIGC 是真的没有特别的价值的,只能说一部分非常机械式的工作可以 offload 到 AI 去做(比如 ComfyUI 做灵感发散和生成 —— 应对的是以往创意的试错很高,LLM 做总结和语义拆分、分类和整理 —— 应对的是海量的数据需要处理,或者 Agent / Completion 做代码补全 —— 应对的是重复代码和重构代码的工作),大家使用 AI,并不会因此就不需要工作了,反而会需要做更多的事情,比较每个用 AI 的人实际上都是比原本更强大的人了,设计的领域也会更广,对吧?
最悲观的是:这件事情甚至是无法避免的,也许这就是 模因污染 吧。
现在大家只是看到有创作者用 AI 工具批量生成内容赚取流量来钻赚钱的空子,那如果这个过程变得更自动化了呢?比如,全自动地调用 ComfyUI 和 Sora 生成更多的垃圾视频填充到时间线上。国庆期间大家很欢呼和喜好的 Sora 这样的 App,本质就是一个彻底 AIGC 驱动的 Tiktok(or 抖音),在剥夺注意力资源之外,也在视频(这个本身就缺乏数据集)的模态上上产生更多的垃圾数据。
我知道有其他的公司和企业正在开发完全由 Agent(根据历史的 chat history 和形成的 memory)去精确地通过你交给 AI 的对话数据判定用户画像,然后生成专属于用户和用户确实会喜欢的 feed 推荐流,实现真正意义上的 agent driven Tiktok(这样的东西没有实质上的技术难题或者工程上做不到的事情,只要能负担得起分析 agent 的成本就可以做到),我理解投资行业对于寻找到下一个 AI 时代的 Tiktok 的欲望非常强,但这对人类文明来说是好不负责任的,不正确的发展方向。
就算是我工作范围内的 RAG 和 知识召回、memory 这件事情上,现在也已经遇到了超级多的正确性和召回后的信息有价值与否的难题了,而且这似乎是无法被量化和可被评估的数据(因为 fact check 真的是非常费力的事情,也有前两天的论文介绍了 small segment of information can pollute how ai searches(在 bilibili 上也有别的博主制作过类似的视频介绍类似的实验))。现有的若干 Deep Search 在 可信信息 的算法上也依然是用工程或者 reranker 来实现的排序,总是会有漏洞,也并不会在语义上和事实上对信息进行 fact check,最多也就是进行多个信源的处理实现交叉检查。
那如果我们看看「数据就是 AI 的石油」这样的 Ilya 也说过的话呢?难到这些 AIGC 就没有任何意义吗?有一部分意义,在 LLM training 和 post-traing 上,synthetic data(合成数据)是非常重要的部分,实际上对于具身智能也是如此,洗数据是非常困难的事情,data 是 somehow 的劳动密集型行业,现在可以堆人,未来呢?如果互联网上都充斥的是垃圾数据呢?也许未来某天,无法采用互联网数据的时候,就必须要有专门的行业专家 / 专家模型在特定领域生成数据才行了。。。
哦对,在减少工作量和提供更多岗位上,AIGC 是真的没有特别的价值的,只能说一部分非常机械式的工作可以 offload 到 AI 去做(比如 ComfyUI 做灵感发散和生成 —— 应对的是以往创意的试错很高,LLM 做总结和语义拆分、分类和整理 —— 应对的是海量的数据需要处理,或者 Agent / Completion 做代码补全 —— 应对的是重复代码和重构代码的工作),大家使用 AI,并不会因此就不需要工作了,反而会需要做更多的事情,比较每个用 AI 的人实际上都是比原本更强大的人了,设计的领域也会更广,对吧?
最悲观的是:这件事情甚至是无法避免的,也许这就是 模因污染 吧。
October 11, 2025
November 6, 2025
Forwarded from 箱子跑来跑去📦
介绍一下我的新项目——ChatTutor。这是一个突破性的「可视化交互式 AI 教师」,不仅能够通过文字与你对话,更能使用电子白板进行直观教学
与传统聊天机器人不同,ChatTutor 将真实课堂中的教学工具——黑板、几何绘图、函数图像、思维导图等——全部带到了数字世界。AI 真正拥有了"动手教学"的能力,让学习 STEM 科目变得更直观和高效
在计划中的功能:
数学画板 - 动态绘制函数图像、几何图形
代码页面 - 编程教学与实时执行
思维导图 - 知识结构可视化
物理画板 - 实验现象模拟
数字逻辑画板 - 逻辑电路演示
GitHub 地址:https://github.com/sheepbox8646/ChatTutor
与传统聊天机器人不同,ChatTutor 将真实课堂中的教学工具——黑板、几何绘图、函数图像、思维导图等——全部带到了数字世界。AI 真正拥有了"动手教学"的能力,让学习 STEM 科目变得更直观和高效
在计划中的功能:
数学画板 - 动态绘制函数图像、几何图形
代码页面 - 编程教学与实时执行
思维导图 - 知识结构可视化
物理画板 - 实验现象模拟
数字逻辑画板 - 逻辑电路演示
GitHub 地址:https://github.com/sheepbox8646/ChatTutor
👍6😱4🔥2❤1
November 7, 2025
November 9, 2025
卡比的驭天飞行者 ❌
绝地潜兵 2 ✅
CG 画质可以啊,没想到 Nintendo 现在都这么舍得,居然还有一整套世界观,那马车... 岂不是...
绝地潜兵 2 ✅
CG 画质可以啊,没想到 Nintendo 现在都这么舍得,居然还有一整套世界观,那马车... 岂不是...
🤗4
November 20, 2025
Forwarded from Hacker News
Bun has been acquired by Anthropic (🔥 Score: 161+ in 24 minutes)
Link: https://readhacker.news/s/6GDZD
Comments: https://readhacker.news/c/6GDZD
Link: https://readhacker.news/s/6GDZD
Comments: https://readhacker.news/c/6GDZD
Bun
Bun is joining Anthropic
Bun has been acquired by Anthropic. Anthropic is betting on Bun as the infrastructure powering Claude Code, Claude Agent SDK, and future AI coding products & tools.
🤔5
December 3, 2025
Forwarded from 洛灵国
终于更新了一版 Telegram Search 的 README,应该更有人味了~
您是否曾因 Telegram 无法搜索中文聊天记录而苦恼?
或者想查找一条重要消息,却因消息过多而难以定位?
现在,使用 Telegram Search,您可以轻松查找和导出自己的 Telegram 消息。强大的语义搜索支持所有语言,完美应对无分词句子的检索场景。
同时支持向量搜索,实现句子级别的模糊匹配,让查找更智能、更准确。
您是否曾因 Telegram 无法搜索中文聊天记录而苦恼?
或者想查找一条重要消息,却因消息过多而难以定位?
现在,使用 Telegram Search,您可以轻松查找和导出自己的 Telegram 消息。强大的语义搜索支持所有语言,完美应对无分词句子的检索场景。
同时支持向量搜索,实现句子级别的模糊匹配,让查找更智能、更准确。
🐳6
December 15, 2025
December 20, 2025
This media is not supported in your browser
VIEW IN TELEGRAM
Merry Christmas 🎄
很好看首页,使我原地脸红
画师 fafafafa
更新了博客,给大家发贺图
https://airi.moeru.ai/docs/zh-Hans/blog/merry-christmas-2025/
很好看首页,使我原地脸红
画师 fafafafa
更新了博客,给大家发贺图
https://airi.moeru.ai/docs/zh-Hans/blog/merry-christmas-2025/
2🥰16
December 25, 2025
December 25, 2025
January 1
我看现在 AI 写东西已经不只是泡沫了,已经变成一种博弈了
-「我不这么 rush 别人就会这么 rush」
-「只要不是 coding agent 拉满的就会觉得马上落后了」
导致是个公司都在拉一坨一坨的,管你喜不喜欢还是是否还有时间和精力这么做,都拉上去做
是否有人想过,实际上做产品,是可以有品位一些,然后慢慢改进和迭代的,做好产品;
是否有人想过,实际上写代码是不用那么 rush 的,是可以静下心来,突破自己的认知极限的,做好 hacker;
我理解像是 yetone 老师提到的,作为 builder 的爽感的,每次我快要解决某个问题把它串起来的时候,我都会觉得,this will gonna work,one step away 的感觉
可是 coding agent 真的给了我 builder 的快乐吗?我觉得我找不到那种快乐的瞬间了,那种刻在 DNA 里的,欢愉到每次和大家线下 meet 的时候都会愿意分享出来的那种 开心
你说 ai native 的应用就是需要填线,我觉得没问题啊,但是目前整个市场/community/ecosystem 就是:「你不做这个我也可以做一个」,然后相互拼 token 和 agent 的 harness 去比功能点。
我怀疑这不只是很多资方、leader 和 manager 的问题,我是想要剑指那些以「抢夺注意力」为主的产品和「没有新功能我就不好做宣发」的增长的
别整那些有的没的了,我就想问问各位 vibe 出来的东西,有多少是真的愿意一直用的,是否还记得某个 vibe 出来的需求是为什么而做的,后面还有测试吗?用户真的喜欢吗?
coding agent 普及后,还有什么是大家都有的限制
品味?想象力?我觉得是时间。
不知道什么时候我已经养成了睡觉前一定要给 codex 写一个超级无敌长的提示词要它去探索一个方向,结果经常一写就是一个多小时,做什么事情前都觉得这点时间不给 codex 发点任务亏大了。
只可惜做出来的大部分东西我都不爱看。自己可能再也用不到了。
-「我不这么 rush 别人就会这么 rush」
-「只要不是 coding agent 拉满的就会觉得马上落后了」
导致是个公司都在拉一坨一坨的,管你喜不喜欢还是是否还有时间和精力这么做,都拉上去做
是否有人想过,实际上做产品,是可以有品位一些,然后慢慢改进和迭代的,做好产品;
是否有人想过,实际上写代码是不用那么 rush 的,是可以静下心来,突破自己的认知极限的,做好 hacker;
我理解像是 yetone 老师提到的,作为 builder 的爽感的,每次我快要解决某个问题把它串起来的时候,我都会觉得,this will gonna work,one step away 的感觉
可是 coding agent 真的给了我 builder 的快乐吗?我觉得我找不到那种快乐的瞬间了,那种刻在 DNA 里的,欢愉到每次和大家线下 meet 的时候都会愿意分享出来的那种 开心
你说 ai native 的应用就是需要填线,我觉得没问题啊,但是目前整个市场/community/ecosystem 就是:「你不做这个我也可以做一个」,然后相互拼 token 和 agent 的 harness 去比功能点。
我怀疑这不只是很多资方、leader 和 manager 的问题,我是想要剑指那些以「抢夺注意力」为主的产品和「没有新功能我就不好做宣发」的增长的
别整那些有的没的了,我就想问问各位 vibe 出来的东西,有多少是真的愿意一直用的,是否还记得某个 vibe 出来的需求是为什么而做的,后面还有测试吗?用户真的喜欢吗?
coding agent 普及后,还有什么是大家都有的限制
品味?想象力?我觉得是时间。
不知道什么时候我已经养成了睡觉前一定要给 codex 写一个超级无敌长的提示词要它去探索一个方向,结果经常一写就是一个多小时,做什么事情前都觉得这点时间不给 codex 发点任务亏大了。
只可惜做出来的大部分东西我都不爱看。自己可能再也用不到了。
❤13😢8🐳1
January 23
January 29
February 1
更新了我们自己的事件 + 流式 RPC 通信层 Eventa 实现的文档
https://github.com/moeru-ai/eventa
几乎是把 Web/Node.js 里面常见的 event emitter / event target 全部都做成 adapter 接了一圈
什么 Electron IPC 啊,Worker 里面搞 invoke 啊,还是说比较 loosy 的事件管理啊,或者说想做 gRPC 那种单向/双向 stream 的各种流式组合,还能有 AbortSignal 也处理好的,Eventa 这边都做了
现在 Project AIRI 和几乎周边生态写的全部的和事件 / worker 有关的库/应用都是 Eventa 驱动的
你说 antfu 老师的 birpc 都有了为什么还要 eventa 呢?
那我觉得 birpc 就是很多地方不好好考虑 adapter 的快速接入和 streaming 的互操作的… 而且 method 的定义也不是那么舒服…
eventa 甚至可以定义完了之后直接打包到处 share,它底层就是个简简单单的对象而已。
配合我们自己写的 Injeca 依赖注入小工具 https://github.com/moeru-ai/injeca ,就算是写一些库也可以无脑用 eventa 实现彻底的 event-based 懒依赖控制
https://github.com/moeru-ai/eventa
几乎是把 Web/Node.js 里面常见的 event emitter / event target 全部都做成 adapter 接了一圈
什么 Electron IPC 啊,Worker 里面搞 invoke 啊,还是说比较 loosy 的事件管理啊,或者说想做 gRPC 那种单向/双向 stream 的各种流式组合,还能有 AbortSignal 也处理好的,Eventa 这边都做了
现在 Project AIRI 和几乎周边生态写的全部的和事件 / worker 有关的库/应用都是 Eventa 驱动的
你说 antfu 老师的 birpc 都有了为什么还要 eventa 呢?
那我觉得 birpc 就是很多地方不好好考虑 adapter 的快速接入和 streaming 的互操作的… 而且 method 的定义也不是那么舒服…
eventa 甚至可以定义完了之后直接打包到处 share,它底层就是个简简单单的对象而已。
配合我们自己写的 Injeca 依赖注入小工具 https://github.com/moeru-ai/injeca ,就算是写一些库也可以无脑用 eventa 实现彻底的 event-based 懒依赖控制
👍4❤2
February 6
Forwarded from cosine - 前端人の日常频道
#GitHub #开源 #AI #新动态
GitHub 正在讨论开源项目维护者如何应对日益增加的低质量、AI 生成的拉取请求(PR),可能包括允许用户完全禁用 PR,或者至少限制 PR 只能由协作者访问等操作,可以在这里参加讨论:Exploring Solutions to Tackle Low-Quality Contributions on GitHub
GitHub 正在讨论开源项目维护者如何应对日益增加的低质量、AI 生成的拉取请求(PR),可能包括允许用户完全禁用 PR,或者至少限制 PR 只能由协作者访问等操作,可以在这里参加讨论:Exploring Solutions to Tackle Low-Quality Contributions on GitHub
GitHub
Exploring Solutions to Tackle Low-Quality Contributions on GitHub · community · Discussion #185387
Hey everyone, I wanted to provide an update on a critical issue affecting the open source community: the increasing volume of low-quality contributions that is creating significant operational chal...
❤1
February 7
February 17
February 20
February 21
Forwarded from 笔记本:Lin's 文字世界 : 个人见闻/B站视频/网络见闻
CHI 2026三篇Neuro-sama论文
人机交互顶会CHI2026惊现三篇分析Neuro-sama的学术论文,分别来自克莱姆森大学、圣母大学和港科大广州团队。研究者用问卷、深度访谈和超50万条弹幕/评论分析,揭示了AI VTuber如何重塑直播体验。
最反直觉的发现是:AI的"缺陷"成了魅力。随机性、逻辑错误、重复发言这些传统AI要消灭的问题,被粉丝重新诠释为"混沌萌点"和"青少年叛逆"。Neuro的不可预测性反而吸引了92%的观众,技术不完美转化为独特的娱乐价值。
更颠覆的是付费逻辑。研究显示Neuro的弹幕互动率和Super Chat付费率高于同水平人类VTuber,因为观众发弹幕等于给AI发prompt,SC购买的不再是表演打赏,而是"共同创造直播内容"的参与权。粉丝与算法共同决定话题走向,建立起一种新型的共创经济。
Beyond a Conventional Chatbot: How AI Streamers Transcend Live
Streaming Experiences from Viewers’ Perspectives:
https://huyang.life/Papers/chi26.pdf
My Favorite Streamer is an LLM: Discovering, Bonding, and Co-Creating
in AI VTuber Fandom: https://arxiv.org/pdf/2509.10427
Even More Kawaii than Real-Person-Driven VTubers? Understanding How
Viewers Perceive AI-Driven VTubers: https://arxiv.org/pdf/2509.20817
#NeuroSama #AIVtuber #CHI2026 #人机交互 #虚拟主播
人机交互顶会CHI2026惊现三篇分析Neuro-sama的学术论文,分别来自克莱姆森大学、圣母大学和港科大广州团队。研究者用问卷、深度访谈和超50万条弹幕/评论分析,揭示了AI VTuber如何重塑直播体验。
最反直觉的发现是:AI的"缺陷"成了魅力。随机性、逻辑错误、重复发言这些传统AI要消灭的问题,被粉丝重新诠释为"混沌萌点"和"青少年叛逆"。Neuro的不可预测性反而吸引了92%的观众,技术不完美转化为独特的娱乐价值。
更颠覆的是付费逻辑。研究显示Neuro的弹幕互动率和Super Chat付费率高于同水平人类VTuber,因为观众发弹幕等于给AI发prompt,SC购买的不再是表演打赏,而是"共同创造直播内容"的参与权。粉丝与算法共同决定话题走向,建立起一种新型的共创经济。
Beyond a Conventional Chatbot: How AI Streamers Transcend Live
Streaming Experiences from Viewers’ Perspectives:
https://huyang.life/Papers/chi26.pdf
My Favorite Streamer is an LLM: Discovering, Bonding, and Co-Creating
in AI VTuber Fandom: https://arxiv.org/pdf/2509.10427
Even More Kawaii than Real-Person-Driven VTubers? Understanding How
Viewers Perceive AI-Driven VTubers: https://arxiv.org/pdf/2509.20817
#NeuroSama #AIVtuber #CHI2026 #人机交互 #虚拟主播
❤3🔥1👏1
February 23
February 24
如果说所有人都开始用 coding agent 写代码,所有人的生产力和生产速度都有提升,这时候何来休闲时间可以在等 AI 写代码的时候做别的事情呢?
同事 100% 拉满 harness 的时候你休息不就还是落后了吗?
搞不懂哪里来的那么多 vibe coding 爱好者,明明会让我更加忙的焦头烂额,多人协作的时候更是经常在某个代码上反复 regression
改进了生产速度,但平均注意力消耗反倒是提升了,即便是采用 Luban 或者 entire 也还是如此,并不是梦一下就什么都有了
同事 100% 拉满 harness 的时候你休息不就还是落后了吗?
搞不懂哪里来的那么多 vibe coding 爱好者,明明会让我更加忙的焦头烂额,多人协作的时候更是经常在某个代码上反复 regression
改进了生产速度,但平均注意力消耗反倒是提升了,即便是采用 Luban 或者 entire 也还是如此,并不是梦一下就什么都有了
1👍5❤2
February 24