Hi there 👋

Welcome to my blog, my name is Ray. I am a software developer and this is my personal blog where I share my thoughts, experiences, and projects. Feel free to explore and connect with me!

观李开复访谈有感

李开复 - 维基百科,自由的百科全书 首先总结我对他的认识,零一万物的 CEO,和我爸一个年纪,过去的经历和争议我不太了解,第一次看到他是从两个访谈,一个是抖音他自己的号发的采访(《华尔街日报》领导力研究院院长艾伦·默里(Alan Murray)和他的对话),一个是虎嗅的采访,我google 了一下关键词,虽然几个类似的热点好像在两年前就有炒过,并且很多人对他的评价褒贬不一,但是由于我孤陋寡闻,现在才接触到这两个内容,对我而言还是有一些帮助,所以记录一下。 这个是还有一个原因来自于这篇文章带来的提醒为什么懂得越多的人,越容易陷入“输入狂热,输出瘫痪”有空也得再写一篇 我总结一下虎嗅的采访中的关键点 他见了谁 最近一直在飞来飞去见各种 CEO 甚至总统 见这些人干嘛 (赚钱嘛)扯了很多,其实就是从上而下的 FDE(也许可以这样说)/解决方案提供 他们公司的业务现在做的是什么 To B 做类似 Palantir 干的活,这个公司我第一次听说,叫 GPT 帮我总结他是个给政府和大型机构做数据 + AI + 决策 + 行动的一体化操作系统公司。 他们对未来的看法 要盈利,然后盈更多的利 哈哈哈我总结的也很简单,但是为什么说对我来讲有帮助,真正让我有收获的,并不是李开复本人,而是采访里的一个信号:很多 AI 公司已经不再讨论模型,而是在讨论企业如何真正把 AI 接进业务流程。对我而言一来扩展了好多领域的词,原来一些大公司如 Palantir 做这些出发点这么早,二来也确实回答了我现在所在公司看到的情况,给别的企业开发也好,咨询也好,一个 Agent 产品,软件,系统,是很难切入公司的运转流程,里面有一个比喻那就是“马车装火车引擎”。 由于我对其他产业的了解实在很浅薄,我用程序员 软件开发公司来比喻,同时 AI 也是在如今开发领域落地最成熟的。从一个未接触 AI 的程序员的角度出发, 今天我了解了 codex 能帮助我写代码,一个月花 20 刀就够了,写了两天发现得用 200 刀,而工资没有超过 2000 刀,这个成本很高。 AI 把我的活都干了,在公司里我干的活更快了,而在一个公司里如果是协作状态,我的高产出会给到我的下游压力。下游同事的角度就不爱干了,同时也会给平级同事压力,大家都不用 AI 产出都差不多,而我遥遥领先,是不是显得他们没用(工贼!) 大家都用 AI,消耗很高,要公司买单,老板终于接触到 AI 了,一开始开心点头,没多久发现这笔账不划算。因为 十个人+十份 AI 套餐的产出其实有冗余,因为公司一般不会需要不停的新开发, 居然还不如 五个资深会用 AI 的+ 五份套餐,降本后也能维持原本的效果。 这应该是 AI 在过去一段时间大部分公司落地最明显的场景。而这个场景,和我们这种公司无关,赚不到钱。因为大家都想用顶级模型,如果有企业内网开发,需要自部署顶级模型,比如 GLM5.2,算一下权重接近 1T 多的大小,一台8 卡H20的服务器在 130 万左右,只能跑个量化模型,还很难支持并发,这在开发场景下几乎不可用,这个账一算就是无法接受的。那么这条路也堵死了。也许也有人愿意跑一些小型模型,比如 Qwen 系列 80-30B 之间的各种模型,这样子成本下来了,但是模型的能力也下来了,也许只能做很小部分的辅助(补全),根本做不到提效的效果。 ...

June 29, 2026 · 1 min · 148 words · Ray

OpenAI Codex CLI-使用教程

原文地址:OpenAI Codex CLI | New API OpenAI Codex CLI 项目介绍 Codex CLI 是一个来自 OpenAI 的编码代理,可在您的计算机上本地运行。 官方主页:https://chatgpt.com/codex 项目主页:https://github.com/openai/codex 效果演示 特性 功能分类 特性 终端式编码助手 Codex CLI 是一个基于终端的交互式编码助理,用于在命令行中编辑代码、生成补丁并运行命令。 工具驱动架构 提供 apply_patch、shell、update_plan、multi_tool_use 等工具,用于对仓库文件和操作进行可控修改。 原子补丁编辑 使用专门的补丁格式通过 apply_patch 原子地添加/更新/删除文件,便于审计与回滚。 沙箱与审批 支持沙箱策略(如 workspace-write、read-only)和审批模式(on-request、on-failure、never),控制写入与网络访问权限。 计划追踪 update_plan 用于列出步骤并跟踪状态,要求始终只有一个 in_progress 步骤以保持明确进度。 交互规范 在重要操作前发送简短前导说明,保持语气友好、简洁并提供进度更新。 安全约束 遵循严格规则(不随意更改无关文件、不添加版权头、不执行破坏性命令),需要用户批准敏感操作。 测试与格式化 推荐在修改后运行相关测试与格式化工具,但不负责修复与当前任务无关的问题。 输出与风格 最终输出遵循 CLI 渲染规范(例如 ** 标题、反引号表示路径/命令),保持可扫描的简洁结构。 并行执行 支持通过 multi_tool_use.parallel 并行运行多个工具以提升效率。 AI 模型配置方法 Windows 端图文指引 1.打开终端 2.安装 WSL 为在 Windows 上获得最佳性能,请安装并使用 Windows Subsystem for Linux (WSL2)。 ...

June 28, 2026 · 3 min · 547 words · Ray

rg 入门教程

今天在看 codex 的 system prompt 看到对 codex 的要求是 优先用 rg,我只知道这个工具比 grep 快,似乎是个现代化的 grep,那得学,我是现代人。 参考了几篇文章:Levon 的 文本搜索神器rg的使用教程、Autumn Skerritt 的 Ripgrep cheatsheet、Marius Schulz 的 Fast Searching with ripgrep,以及官方的 ripgrep README 和 User Guide。 这篇不是全文搬运。我只是把我最可能用到的东西重新按自己的脑回路记一遍。 rg 是干嘛的 一句话: rg 是用来在文件里搜文字的命令。 它的全名叫 ripgrep,但是命令名是 rg。 最基础的样子长这样: 1 rg "要搜索的内容" 这行命令的意思是: 在当前目录下面,递归搜索所有文件,只要某一行包含 "要搜索的内容",就把那一行打印出来。 这里有几个初学者必须先钉死在脑子里的点: rg 默认就是递归搜索,不用像 grep -R 那样自己加 -R 不写目录时,默认搜当前目录,也就是 ./ 它默认会读 .gitignore 它默认不搜隐藏文件,比如 .env 它默认不搜二进制文件,比如图片、数据库文件 它默认把搜索内容当正则表达式,不是纯字符串 安装和确认 Mac 上一般就是: 1 brew install ripgrep Ubuntu / Debian: 1 sudo apt-get install ripgrep Windows 如果用 Scoop: ...

June 24, 2026 · 4 min · 830 words · Ray

什么是AI反代,和反代什么区别

忘了在哪个群,有位大学新生询问我什么是 AI 反代,同时我突然意识到博客很久没有更新了,于是想到这个可以水一篇。关于正代反代和 AI 反代。 概念 首先 这个词是 正向代理和反向代理的简称,之前一般是用在网络应用层,如果用过nginx 部署项目也许就听说过,那么简单讲一下什么是正向代理,什么是反向代理 正向代理 小王(客户端) 要找 小李(服务器)租房,但是小王不想用自己的名义向小李租房,于是他叫小徐 (代理)去帮忙租房。这种隐藏小王身份的方式,就叫做正向代理 反向代理 小王(客户端)找 小李(代理)租房,但是小李就像二房东或者中介是在小王不知情的情况下去找小徐(服务端)租房然后把房子给小王。这会隐藏小徐的身份,这叫反向代理。 就像你在城中村签了租房合同直到最后退租可能都不知道真实房东是谁。二房东就在做反向代理。 AI 反代 AI 反向代理(AI Reverse Proxy)是指将主流 AI 服务(如 OpenAI、Claude、Gemini 等)的官方接口进行中转和协议转换的本地或云端服务。 它主要分为两大类用途: 标准 API 转换:将官方网页版(如 Google AI Studio)或不支持直接调用的平台转换为标准的 OpenAI 格式接口,供第三方客户端(如 Cherry Studio)调用。 网关中转与分流:管理多个 API 账号、进行负载均衡(解决频率限制)、隐藏真实 IP、或在国内网络环境下加速 API 访问 总结 正向代理隐藏的是客户端身份,但不是对所有人都隐藏。代理是知道客户端是谁的。 反向代理隐藏的是真实服务端,但也不是绝对隐身。响应头、错误页、日志、证书配置这些地方都可能漏出后端信息。 那么到这一步应该会发现 AI 反代这个词本身不是特别合理,但是这个词的含义已经被泛化和转义了,它不仅包含了网络层面的中转,更核心的功能是协议转换、身份伪装和多账号聚合。 这个称呼的演变主要是因为以下两个历史原因: 最早的刚需是“网络中转”:早期国内开发者无法直接连接 OpenAI 官方 API。大家最开始的做法是用 Cloudflare Workers 或海外 VPS 搭一个 Nginx,把请求直接转发给 OpenAI。这个阶段它确实是标准的网络反向代理。 概念被沿用并扩展:后来,单纯的“网络中转”无法满足需求(比如需要解决多账号限频、网页端 Cookie 登录、异构模型统一输入等问题)。开发者便在“中转服务器”上编写了业务代码(如 Python/Go)。虽然它已经变成了**“网关(Gateway)”或“中间件(Middleware)”**,但大家依然习惯性地称其为“AI 反代”。

June 22, 2026 · 1 min · 69 words · Ray

GLM 到底怎么才能抢到

GLM 5.2 已经上线一周多了,自从 5 出来后,对于国模编程 NO.1 的名号也是听说多次,前面包括 5.1 都浅试过,不过由于 claude 和 GPT 对我而言获得还算容易所以一直没有在意,这次 5.2 出来恰逢 claude 各种波折,可以说几乎很费劲才能维护 claude 的订阅,更何况我需要给团队多位开发同学分发。所以准备看看 5.2 的能力,在 Zcode 浅浅试了两天发现确实还可以,但是 free 的 差不多一个问题二十分钟,reconnect 占用了十五分钟,本以为买个 coding plan 会成为人上人,没想到送钱还得抢着来。整整一周,每一天10AM 准时蹲在浏览器前面。 不曾想,不管是我用任何脚本还是手搓、还是从 zcode 里面订阅,亦或是换不同的网络去订阅,都无济于事,整整一周啊,我抢了七天多都没抢到。 看到有网友讨论国际版能直接买,(囊中也不是很丰腴)关键让我不敢直接买的原因还是在于听网友已有 max 订阅的体验甚至也会因为算力不足而429。 国模加把劲啊。🥹

June 22, 2026 · 1 min · 38 words · Ray