Wey Gu 古思为

18.9K posts
Opens profile photo
Wey Gu 古思为
@wey_gu
Build things, troubleshoot& sing. Co-Founder , build & nowled.ge/kl Microsoft MVP. Feminist. Prev , Cloud
@siwei@mas.tosiwei.io/en/

Wey Gu 古思为’s posts

Pinned
Introducing Nowledge Mem the Context/Memory Manager connecting dots among all Agents in your daily workflow. It enables retrieval, sinking & distilling over your insights, conclusions & precious findings. It persists and by default computes everything locally. #buildinpublic
2:24
被朋友圈所有的上海同学都在转发明知道会被删掉的视频,看起来是第一次。 现在开始通过编辑改变文件hash的方式再分发。 给他们点赞。
我非常看好 cua,他们在 macOS 下用原生的 macOS 虚拟化层实现了快速启动的 vm,封装为容器的体验(有自己的 image registery),类似 cata container,这让那些本来依赖云上 vm 资源 computer use 完成桌面 rpa 需求的、或者通用目的的 agent、特定需要 macOS 生态的 agent 变得特别
Quote
Y Combinator
@ycombinator
Cua (@trycua) is the Docker for computer-use agents, an open-source framework that enables AI agents to control full operating systems within lightweight virtual containers, and works with any language model. ycombinator.com/launches/NJc-c Congrats on the launch, @francedot +
0:01 / 0:59
这个课程前几周已经发布了,是关于 GitHub Copilot 的实践课程,很难想象我把这个话题出了十课时,其中有一课还有一个小时,之前都没好意思在 twitter 发。 今晚会在极客时间营业,说说大模型、开源、图和 #NebulaGraph (of course) 这个照片动作真是太难为情了🤦🏻‍♀️
Quote
Wey Gu 古思为
@wey_gu
- 8 天时间撸出来一个极客时间公开课,过几天会公开。 - 我的老板支持我在工作时间来准备这件事儿,只要我认为它有价值。 - 老板提醒不用刻意提到 #NebulaGraph 明天可以接着撸 github.com/wey-gu/nebulag 啦。
我画图都是用 asciiflow,被 GitHub 推荐了。
Quote
GitHub
@github
Need to add some ASCII art flow diagrams to your README or code comments? YES → asciiflow.com (งツ)ว
The media could not be played.
“我看了一下他们的招生简章,差点把我看哭了。教育目标和内容一栏,写的不是要学会多少加减法,掌握多少词语。 而是——培养起基于爱和信任的交流,拥有感受美丽事物的能力,能表达出自己的感动,可以传达给他人喜悦,培养出一颗明朗沉稳的心。 m.weibo.cn/status/4889841
Image
想起来我上大学那会儿,经历了墙的从无到有。也经历了从改一改 dns 就好用,到收集 google 服务、YouTube、twitter 等所有域名 hosts 每天替换的一个翻墙阶段(一开始 ipv6 墙矮,在教育网额外用过 ipv6 的 hosts),也是一样的情况。 后来就是 google app engine 上跑隧道 serverless
Quote
Xiangyu 香鱼🐬
@XianyuLi
作为一个臭学生物的,靠着 Claude Code 糊了个能给 GitHub 提速的小工具。意外地——还挺好用。 事情要从一次实验室聚餐说起。那天吃小龙虾,师弟一脸无奈地抱怨: “GitHub 根本上不去啊,要么龟速,要么直接超时。” (还不是老板想ai4science逼的!) 更绝的是——他一个研究生折腾不来“扶墙”工具!
昨天的内部会议上,老板 Sherman 和大家说了我会出来创业,还让我和大家说说,我一时只知道感谢,没说出什么。然后大家私聊给了不少祝福。 昨天下午 pycon 的文章发出来,这次我和 team 里的卓燃、yanli 都有主题,不过第一次我的 title 不是 NebulaGraph 的了,心里还真有点酸酸的。 9.15 是我的
SSH 三种隧道 - 把远端机器的一个 port 映射到本地的一个 port,比如我在开发 NebulaGraph Catalyst 的时候,会把集群中的一堆服务跑在服务器,映射到本地,主进程在本地开发调试,轻量、方便(local) - 把本地端口映射到远端一个端口,比如调试需要公网上的 api hook
Quote
plantegg
@plantegg
如果不想看书,就记住-vvv 参数(Debug 信息丢给大模型),服务端对应可以用-ddd;第二用好 ~/.ssh/config 配置文件(不存在的话可以手工创建),这个配置文件我配了几千行,如图 x.com/plantegg/statu…
Image
因为不想直接暴露家里端口(虽然有公网ip),也没搭隧道,每次出差的时候因为连不上 homelab 总感觉自己不是完整的自己。 是时候搭一个隧道了。
Replying to
我是数学专业的,大学期间完全不会 coding,毕业了从事通信相关工作,大概因为不想重复自己、兴趣使然自学成为野生程序员,然后成为了全职的程序员。 对于喜欢 build things 的人来说,“转码”更像是非麻瓜小孩找到了魔法学校,开源社区是最好入学的一间学校。
这个太有意思了,Postgres 做计算层,用 http call function,function 里调 SQLite(文件压缩存S3 上的)作为时序数仓,比一些 managed service 便宜还快。
Quote
Simon Willison
@simonw
Fascinating HN comment from someone who's company built a custom distributed data warehouse using compressed SQLite DB files in S3 that were queried using Lambda functions orchestrated by PostgreSQL running a custom foreign data wrapper news.ycombinator.com/item?id=314877
temuze:

Back at my old job in ~2016, we built a cheap homegrown data warehouse via Postgres, SQLite and Lambda.

Basically, it worked like this:

- All of our data lived in compressed SQLite DBs on S3.

- Upon receiving a query, Postgres would use a custom foreign data wrapper we built.

- This FDW would forward the query to a web service.

- This web service would start one lambda per SQLite file. Each lambda would fetch the file, query it, and return the result to the web service.

- This web service would re-issue lambdas as needed and return the results to the FDW.

- Postgres (hosted on a memory-optimized EC2 instance) would aggregate.

It was straight magic. Separated compute + storage with basically zero cost and better performance than Redshift and Vertica. All of our data was time-series data, so it was extraordinarily easy to partition.

Also, it was also considerably cheaper than Athena...
花了几分钟就弄起来了 的 OpenCat for Team,现在,我的几个亲人朋友可以非常顺滑从 llm 上获得学习、工作的辅助了,感恩,推荐!
Quote
Baye
@waylybaye
大家好,向大家介绍 OpenCat for Team,支持私有部署(docker),只需要一个 API Key 和一个云主机就可以让所有同事、朋友、亲人都用上 ChatGPT。OpenCat 升级到 1.1.7 后就可以在设置里面看到。添加用户后把链接发给他,他就可以直接用 OpenCat 开始聊天了。 x.com/waylybaye/stat…
Image
Image
Image
我们 team 是全员 cursor 的; 我们产品的初稿、原型也完全是 v0 上的; 我试过 visily、uizard 等几个原型的工具,对我来说都不如 v0。
Quote
宝玉
@dotey
今年起程序员投资在Cursor这样的AI工具上,将是未来几年稳赚不赔的一笔重要投资 x.com/meterscao/stat…
最近用了一段时间 chatdoc.com ,感觉还不错,免费额度算是慷慨,聊了一下团队有文档处理的背景,推荐给了几个高校非 cs 背景的同学,反馈也不错,是典型 llm niche 场景了👍 希望能做下去。
最近做了基于 GRPO 和 R1 蒸馏的带有推理过程的 Graph extraction 的数据上的 3B 模型训练,效果非常不错。在我的例子下,超出了 gpt-4o-mini(不算严谨的评估。 因为任务是长 window 的,虽然用了 unsloth 的工作,节省了很多显存,我还是用了 80GiB A100 跑的。 reward function
Quote
九原客
@9hills
GRPO 可以试试 unsloth,实测可以跑通。 不过在业务场景上落地还很久,还在想办法弄数据和奖励函数。还是蒸馏简单。 x.com/unslothai/stat…