Xuwei.dev

欢迎来的我的博客

Sun, 19 Apr 2026 00:00:00 GMT

欢迎来到我的博客 🎉

你好！很高兴你能找到这里。

这里是我记录想法、分享经历、探索技术的小角落。无论你是偶然路过，还是专程而来，希望你能在这里找到一些有价值的内容。

这里会有什么？

💻 技术笔记 — 学习过程中的心得与总结
🧠 想法碎片 — 一些值得记录的思考与感悟
🌏 生活随笔 — 日常中那些有趣的瞬间

关于我

我是 Lixuwei，一名热爱技术的学生，喜欢折腾代码、探索新事物。这个博客是我的数字足迹，也是我与世界对话的方式。

感谢你的到来。如果你喜欢这里的内容，欢迎常回来看看。

"好的开始是成功的一半。"

LLM 和 AI Agent 到底有什么区别？

Sat, 16 May 2026 00:00:00 GMT

从 Grok 接入 Hermes Agent 聊起：LLM 和 AI Agent 到底有什么区别？

最近 xAI 发了一条很有意思的消息：Grok 订阅现在可以直接接入 Nous Research 的 Hermes Agent。

也就是说，用户可以用自己的 Grok 账号和订阅，在 Hermes 这个开源 Agent 里面调用 Grok 的能力。

xAI 官方介绍中提到，Hermes Agent 是一个可以长期运行在电脑、沙盒或 VPS 上的开源自我改进型 Agent，并且可以跨会话保留长期记忆。

这个事件其实很适合拿来解释一个现在很常见的问题：

LLM 和 AI Agent 到底有什么区别？

很多人第一次接触 AI 的时候，会把 ChatGPT、Claude、Gemini、Grok 这些都统称为“AI”。

这当然没错，但如果再细分一点，它们背后其实有两个不同层次的概念：

一个是 LLM，大语言模型
另一个是 AI Agent，智能体

简单来说：

LLM 更像是“大脑”，Agent 更像是“会使用大脑去做事的人”。

🧠 1. LLM 是什么？

LLM，全称是 Large Language Model，也就是大语言模型。

我们平时说的 GPT、Claude、Gemini、Grok，本质上都是 LLM 或基于 LLM 的产品。

它们最核心的能力是：

理解文字
生成文字
推理
总结
翻译
写代码
回答问题

比如你问它：

“帮我解释一下什么是 DNS。”

它会根据你输入的问题，生成一个回答。

你再问：

“帮我写一段 Python 代码。”

它也可以直接生成代码。

所以，LLM 的强项是语言理解和内容生成。

它像一个很强的大脑，知道很多知识，也能根据上下文进行推理。

但是，LLM 本身通常有一个限制：

它主要是在“回答你”，而不是主动帮你完成一整套任务。

比如你让一个普通 LLM：

“帮我把这个项目部署到服务器上。”

它可能会告诉你步骤：

先连接服务器
安装依赖
配置环境变量
启动服务
设置 Nginx
配置域名

但如果没有额外工具，它通常不会真的帮你登录服务器、修改文件、执行命令、检查报错、重新部署。

它会“说”，但不一定能“做”。

🤖 2. AI Agent 是什么？

AI Agent 可以理解为：

在 LLM 的基础上，加上目标、工具、记忆和执行能力。

也就是说，Agent 不只是聊天，它更像一个可以围绕目标持续工作的系统。

一个 Agent 通常会包含几个关键部分：

它有一个 LLM 作为核心大脑
它可以调用工具，比如浏览器、终端、文件系统、数据库、API
它可以记住任务状态，而不是每次都从零开始
它可以规划步骤，并根据执行结果继续调整
它可以在一定程度上自主完成任务

比如你对一个 Agent 说：

“帮我检查这个项目为什么启动失败。”

一个真正的 Agent 不应该只是告诉你“你可以检查日志”。

它应该可以：

打开项目文件
查看配置
运行测试
执行启动命令
读取报错信息
修改代码或配置
再次运行验证
最后告诉你问题在哪里，已经怎么修了

这就是 Agent 和普通 LLM 的区别。

LLM 更像是回答问题。
Agent 更像是完成任务。

🔗 3. 用 Grok × Hermes 事件来理解

这次 xAI 把 Grok 接入 Hermes Agent，其实就是一个很好的例子。

Grok 本身是一个 LLM 产品，它负责提供推理、对话、多模态生成等能力。

而 Hermes Agent 则是一个 Agent 框架，它负责：

长期运行
连接外部工具
保存记忆
处理跨会话任务

所以这件事的本质不是“又出了一个聊天机器人”。

它更像是：

Grok 提供大脑，Hermes 提供身体和工作环境。

或者说：

LLM 负责思考，Agent 负责把思考变成行动。

这也是为什么现在很多 AI 产品都在从“聊天框”走向“Agent”。

因为单纯聊天的价值已经很明显了，但下一步更重要的是：

AI 能不能真的帮用户完成事情？

💡 4. 一个简单类比

我们可以用人来类比。

LLM 像一个很聪明的顾问。

你问它问题，它可以给你建议、解释、方案。

Agent 像一个带工具的助理。

你给它目标，它不只是给建议，而是会尝试执行。

比如你说：

“帮我整理一份课程报告。”

LLM 可能会回答：

“你可以按照背景、方法、结果、总结这几个部分来写。”

Agent 则可能会进一步：

打开你的资料
读取文档
提取重点
生成大纲
写初稿
检查格式
导出文件

这就是区别。

⚖️ 5. LLM 和 AI Agent 的核心区别

可以用一句话总结：

LLM 是能力核心，Agent 是任务系统。

更具体一点：

对比项	LLM	AI Agent
核心角色	大脑	执行者
主要能力	理解、生成、推理	规划、调用工具、执行任务
是否能使用工具	本身不一定	通常可以
是否有长期记忆	不一定	通常强调记忆和状态
工作方式	用户问，模型答	用户给目标，Agent 分步骤完成
典型例子	ChatGPT、Claude、Grok	Hermes Agent、Claude Code、OpenAI Codex 类工具、各种自动化 Agent

当然，现实产品里两者经常混在一起。

比如 ChatGPT 也可以使用工具，Claude 也可以操作代码项目，Grok 也在接入 Agent 框架。

所以不是说某个产品只能是 LLM 或只能是 Agent，而是要看它当前承担的角色。

🚀 6. 为什么 AI Agent 会变得越来越重要？

因为很多真实任务不是一句回答能解决的。

比如：

写一个完整项目
分析一个数据集
部署一个网站
维护一个服务器
处理一批文件
自动回复消息
长期跟进一个学习计划
持续监控某个系统状态

这些任务都有一个共同特点：

它们不是一次性问答，而是一个过程。

过程里面会有计划、执行、失败、修正、验证。

这正是 Agent 的价值。

LLM 可以告诉你“怎么做”。
Agent 则开始尝试“帮你做”。

⚠️ 7. 但 AI Agent 不是万能的

不过，Agent 听起来很强，但也不是完全可靠。

因为一旦 AI 有了工具使用能力，它的风险也会变高。

普通 LLM 说错了，最多是答案不准确。

但 Agent 如果执行错了，可能会：

删除文件
改错配置
调用错误 API
执行危险命令
造成真实损失

所以一个好的 Agent 不只是要聪明，还要有：

权限控制
操作确认
日志记录
沙盒环境
风险检测
可回滚机制

这也是为什么我觉得未来 Agent 的竞争，不只是比谁的模型更强，还要比谁的执行系统更安全、更稳定、更可控。

🎯 8. 总结

这次 Grok 接入 Hermes Agent，可以看作一个信号：

AI 正在从“聊天模型”走向“执行系统”。

LLM 是 AI 的大脑，负责理解和推理。

Agent 是围绕大脑构建出来的行动系统，负责使用工具、记住上下文、规划步骤并完成任务。

所以，当我们讨论 AI 的时候，不能只问：

“这个模型聪不聪明？”

还要问：

“它能不能安全、稳定、可控地帮我完成事情？”

这可能才是 AI Agent 真正重要的地方。

未来的 AI，不一定只是一个聊天窗口。

它更可能是一个长期运行、理解你、记得你的项目、能调用工具、能完成任务的个人助手。

而 Grok × Hermes 这类事件，正是在把这个方向变成现实。

网站优化日志

Sat, 16 May 2026 00:00:00 GMT

起因

博客部署在新加坡的 VPS 上，国内用户访问时总觉得卡顿得厉害。打开浏览器 F12 调试工具一看，问题暴露得很明显：首页竟然有 29.3 MB / 120 个请求，加载时间长达 6 秒。

带宽已经优化为国内 ECS 反代回源新加坡服务器，链路本身基本上接近优化极限了，要进一步加快速度，只能从网站自身的资源优化入手。

一张图直击问题所在

打开 Network 标签，几个“大户”立刻暴露出来：

资源类型	大小
自动播放的背景音乐	6 MB
一张文章封面 PNG	1.5 MB
默认中文字体 ttf	5.4 MB
全屏壁纸原图 PNG	1.4 MB
8 张未使用的 banner 图	1.5 MB

实际的流量大头并非“上百个请求”，而是集中在少数几个本不该如此大的资源上。

优化措施

字体直接“清零”

后台字体设置新增了一个“系统默认”选项，将 CJK 和 ASCII 字体全部改用系统默认字体。浏览器自动选用 PingFang、微软雅黑或 SF Pro，字体文件实现零下载，且渲染效果极佳。

音乐改为用户点击后再加载

播放器组件原先默认进入首页时就会预加载 6 MB 的背景音乐，现在改成 preload="none"，用户点击播放按钮后才会真正发起下载请求。

用户上传图片统一通过 Sharp 优化

增加了一个 /api/image-preview 接口，传入参数如 ?w=1600&format=webp&q=85，服务端按需缩放并转换为 WebP 格式，优化后的图片缓存落盘保存 30 天。这样文章封面由原本的 1.5 MB PNG 降至 200-300 KB WebP，肉眼几乎看不出任何差别。

图片尺寸精确按需调用

封面需要 1600px 宽度，头像只需 400px，音乐封面给 200px，导航 logo 也只需要 200px——以前所有缩略图都是直接调用原图。

全屏壁纸单独使用更小尺寸

区分文章封面和背景图两种用途，全屏背景壁纸统一压缩到 1920px，并采用更高压缩率，视觉效果基本不受影响。

Banner 图使用懒加载

如果用户未默认启用 banner 模式，则所有 banner 图资源均被放置于 <template> 标签内。浏览器对 <template> 中的内容完全不发起请求，直到用户切换到 "Banner" 模式时才动态加载实例化图片。

优化前后对比

优化前：

优化后：

通过以上优化手段，网站首页体积从 29.3 MB 降至 约 5 MB，加载速度提升了近一个数量级。即便在国内 3 Mbps 带宽环境下，也能做到秒级打开，大幅提升用户体验。

网站海内外分流

Sat, 16 May 2026 00:00:00 GMT

起因

中国内地访问速度慢

整体架构

整个方案涉及三个关键角色：

角色	作用
DNSPod 解析	根据访客 IP 判断境内/境外，返回不同的 A 记录
广州阿里云 ECS	Nginx 反向代理和缓存层，缓存命中则秒级返回，未命中则回源新加坡
新加坡甲骨文云	唯一的数据源，包括 Node SSR、SQLite 数据库和上传文件

从用户角度来看，访问的 URL 始终是统一的 blog.apodfg.com，无需记忆多个域名。

三个关键注意点

一、ICP 备案是硬性要求

阿里云大陆机房会严格拦截未备案域名对 80 和 443 端口的访问。

二、DNS 提供商必须支持线路分流

Cloudflare 的国内解析不够稳定，而 Spaceship 等海外注册商又不支持境内外分线路解析。最简单有效的做法是将域名解析服务迁移到 DNSPod 免费版，它免费提供境内和境外两条线路的解析，记录数量也没有限制。

三、缓存策略与回源规则明确区分

/admin/*、/api/*：透传 Cookie，不做任何缓存
/_astro/*、/uploads/*：文件名自带 hash，缓存期限设置为 30 天
HTML 页面：短缓存（5 分钟），配合使用 stale-while-revalidate 策略
视频大文件：关闭 buffer，单独设置长缓存

只要一行规则配置错误，管理后台就可能无法登录；正确配置后，国内用户的访问速度可以瞬间提升。

性能提升数据

#分流后 #分流前

不仅首字节加载速度明显提升，整页加载时间也从原来的 6 秒压缩到了 1-2 秒。

百度文心大模型 5.1 发布

Sun, 10 May 2026 00:00:00 GMT

百度文心大模型 5.1 发布

百度正式发布文心大模型 5.1（ERNIE 5.1），现已开放体验：

🇨🇳 中国版：yiyan.baidu.com
🌍 国际版：ernie.baidu.com

排名表现

ERNIE 5.1 在 @arena 的 Search Leaderboard 上排名全球第 4，得分 1,223。

ERNIE 5.1 Preview 在 LMArena Text 上已获得 1,476 分，排名全球第 13，多个细分类别进入全球前十。

什么是 GPT？它和 ChatGPT 是一回事吗？

Sat, 09 May 2026 00:00:00 GMT

🤖 什么是 GPT？它和 ChatGPT 是一回事吗？

What is GPT? Is it the same thing as ChatGPT?

现在一提到 GPT，很多人第一反应就是 OpenAI 的 ChatGPT。这其实是一个很常见的误区。

Nowadays, when GPT is mentioned, many people immediately think of OpenAI's ChatGPT. This is actually a common misconception.

ChatGPT 确实是基于 GPT 技术开发的"聊天机器人"，但 GPT 本身并不是它的专属名称。更准确地说，GPT 是一种大语言模型的"技术路线"。

ChatGPT is indeed a "chatbot" developed based on GPT technology, but GPT itself is not its exclusive name. More accurately, GPT is a "technical roadmap" for large language models.

🔍 1. 拆解 GPT：它的名字里藏着三个秘密

1. Breaking Down GPT: Three Secrets Hidden in the Name

GPT 的全称是 Generative Pre-trained Transformer。我们可以用最通俗的方式拆开来看：

GPT stands for Generative Pre-trained Transformer. Let's break it down in the simplest way:

字母	全称	中文含义	比喻	Analogy
G	Generative（生成式）	它是"创作者"，不是"搬运工"	不是在搜索引擎里翻找现成答案，而是根据你的要求，现场"写"出内容。无论是文章、代码还是翻译，它都是在主动创造。	It doesn't search for ready-made answers; it "writes" content on the spot based on your request.
P	Pre-trained（预训练）	它是"博览群书"的超级学霸	在正式上岗前，它读过互联网上几乎所有的文本。虽然它不一定像人类一样"理解"每一个道理，但它记住了文字之间的统计规律。	Before going to work, it read almost all the text on the internet. It remembers the statistical patterns between words.
T	Transformer（变换器）	它是自带"聚光灯"的理解专家	想象它看书时自带一个"聚光灯"（自注意力机制），读到句尾的"它"时，聚光灯会自动照回句首的"苹果"。它不只是逐字阅读，而是能瞬间抓住整段话的联系。	Imagine it has a "spotlight" (Self-Attention) while reading — it captures connections within the entire paragraph instantly.

⚙️ 2. GPT 是怎么工作的？（一场高端的文字接龙）

2. How Does GPT Work? (A High-End Word Game)

你可以把 GPT 的工作原理想象成一个极其聪明的"文字接龙器"。

You can imagine GPT's working principle as an extremely intelligent "word-chain game."

步骤 / Step	中文说明	English
🧩 切块 Tokenization	它会把你的话拆成一小块一小块的"积木"（Token）。	It breaks your words into small "Lego blocks" called Tokens.
🎯 预测 Prediction	比如你输入"今天天气很"，它会根据读过的书计算概率：是接"好"的概率大，还是接"苹果"的概率大？	If you input "The weather today is...", it calculates probabilities: Is "nice" more likely, or is "apple"?
🔄 循环 Iteration	它接出一个词，再把这个新词加入进去，继续预测下一个词。	It picks a word, adds it to the sequence, and predicts the next one again.

💡 重点： GPT 的厉害之处在于，它不是在乱猜，而是基于海量知识进行极其精准的概率预测。

Key Point: The brilliance of GPT lies in the fact that it's not guessing blindly; it's making extremely precise probability predictions based on massive amounts of knowledge.

🚗 3. 一个误区：GPT 不等于 OpenAI

3. A Common Myth: GPT Does Not Equal OpenAI

虽然 OpenAI 的 GPT-4 很有名，但 GPT 本质上是一个通用技术术语。

While OpenAI's GPT-4 is famous, GPT is essentially a general technical term.

这就好比"SUV"是一种汽车类型，而"特斯拉 Model Y"是基于这种类型生产的具体产品。

It's like "SUV" is a type of car, while the "Tesla Model Y" is a specific product built based on that type.

概念 / Concept	类比 / Analogy
🔧 GPT	发动机技术 / Engine Technology
💬 ChatGPT	搭载了这个发动机的成品车 / The finished car with that engine
🏢 OpenAI	汽车生产商 / The car manufacturer

事实上，美国和中国的监管机构都曾驳回过 OpenAI 对"GPT"商标的专属申请，因为这个词被认为描述的是一种技术功能，而非某家公司的私有品牌。

In fact, regulators in both the US and China have rejected OpenAI's exclusive trademark applications for "GPT" because the term is seen as describing a technical function rather than a company's private brand.

⚠️ 4. 警惕：它有时也会"一本正经地胡说八道"

4. Warning: It Sometimes "Talks Nonsense with Confidence"

由于 GPT 是靠"概率"生成答案的，它有时会产生"幻觉"（AI Hallucination）。

Because GPT generates answers based on "probabilities," it sometimes creates "hallucinations."

它就像一个极度自信但偶尔"断片"的学者：为了完成文字接龙，它可能会编造一个不存在的法律条文或论文题目。

It's like an extremely confident scholar who occasionally has a "blackout": to finish the word game, it might invent a non-existent law or research paper title.

📌 使用建议： 把它当成你的"头脑风暴伙伴"或"写作润色助手"，但在处理医学、法律等严肃事实时，一定要记得核实。

Usage Tip: Use it as your "brainstorming partner" or "writing polisher," but always remember to verify when dealing with serious facts like medicine or law.

📝 总结 / Summary

GPT 是引擎，ChatGPT 是应用。它是人工智能史上的一次重大突破，让我们第一次拥有了如此接近人类表达能力的机器。

GPT is the engine; ChatGPT is the application. It is a major breakthrough in the history of AI, giving us machines that are closer to human expression than ever before.

GPT-5.5 Instant 发布：Instant 跟 Thinking 模型的区别

Wed, 06 May 2026 00:00:00 GMT

GPT-5.5 Instant 发布：Instant 跟 Thinking 模型的区别

OpenAI 正式开始推送 GPT-5.5 Instant。相比之前版本，它更自然、更简洁，回答速度也更快。官方重点提升了事实准确率、图片理解、多轮对话和个性化能力，同时减少了“AI 味”过重的问题，更像真人交流。GPT-5.5 Instant 未来也会逐渐成为 ChatGPT 默认模型之一。

Instant 和 Thinking 模型有什么区别？

Instant 模型更偏向“快速聊天”和“实时交互”。它的特点是响应速度快、语气自然、适合日常问答、代码辅助、图片分析和连续对话。很多时候它更像一个实时 AI 助手，强调流畅感和陪伴感。

Thinking 模型则更偏向“深度思考”。它会花更多时间进行推理，适合复杂数学题、算法分析、长链逻辑推导、科研问题等场景。相比 Instant，Thinking 模型通常更严谨，但回复速度会慢一些，回答也可能更长。

简单来说：

Instant：更快、更自然、更适合日常使用
Thinking：更强推理、更适合复杂问题

AI即将接管编程

Mon, 04 May 2026 00:00:00 GMT

AI即将接管编程？Anthropic CEO表示一年内AI将写100%的代码

近日，Anthropic的CEO发表了一则引人深思的观点：“AI将在一年内实现100%的代码编写”。

仔细想想，现在的程序员通常需要花费四年的大学学习时间才能熟练掌握编码技能，但Anthropic旗下的Claude却能够从所有出版过的书籍中迅速学习。换句话说，最难的技能已经被AI掌握了。那么，从现在开始，真正的差距不再是你知道多少，而是你如何高效地配置和使用那些掌握全部知识的AI工具。

但现实情况是，大多数人并没有真正做好这方面的准备。

未来的编程：工具配置能力至关重要

如果AI已经解决了最复杂的技能问题，那么我们这些技术工作者的核心竞争力又将是什么呢？其实很简单，就是我们如何善于配置和利用好这些强大的AI工具。

就像数码相机和智能手机的兴起并没有消灭摄影这个行业一样，AI工具的普及也并不会真正淘汰程序员这个职业。相反，它会彻底改变这个行业，让编程变得更加民主化。未来的程序员或许不再亲自编写代码，而是通过精细化的指令和配置来指导AI完成代码生成。

如何应对AI时代的变化？

针对这种趋势，我们又该如何做好准备呢？或许一个关键的切入点就在于提升自己对于AI工具的驾驭能力。

最近在GitHub Trending上，一个名为CLAUDE.md的文件迅速蹿升到榜单第一，获得了8万2千多个星标以及7千8百多个fork。然而遗憾的是，许多Claude用户甚至不知道有这样一个文件存在，即使知道也不清楚具体该如何使用它。

正如文中所述，如果你希望在AI时代保持竞争力，或许现在正是深入了解并掌握这些AI工具的最好时机。

结语

科技的发展总是快于人们的预期。AI的迅猛发展已经明确地告诉我们：未来的关键技能可能不再局限于如何亲自编码，而更在于我们如何驾驭和利用强大的AI工具。

你，准备好了吗？

博客故障排查报告

Wed, 29 Apr 2026 00:00:00 GMT

博客故障排查报告

起因

云服务器异常关机，重启后博客文章正文 404、后台 404、图片丢失。

根因

PM2 自启加载了错误的 Node 版本：系统默认 Node 切到了 v20，但项目 Astro 6.x 要求 ≥ 22.12.0，导致 pnpm build 失败、dist/ 未更新。
better-sqlite3 原生模块 ABI 不匹配：旧 .node 是 v22 编译，运行时却用 v20，触发 Module did not self-register，SSR 无法读 site.db，admin 与文章详情全部 500/404。
数据库 data/site.db 与上传文件均健在，未发生数据丢失。

修复

切回 Node 22 → npm install --build-from-source 重编 better-sqlite3 → pnpm build → pm2 delete && start，并用 nvm alias default 22 锁定版本防复发。

小米 MiMo-V2.5 开源了

Tue, 28 Apr 2026 00:00:00 GMT

小米MiMo-V2.5系列开源了

小米MiMo官网

</div> <br> <div align="center">

Xiaomi MiMo在X上发文

</div> <br>

简单说：小米把最新的 AI 模型 MiMo-V2.5 开源了，用的是 MIT 许可证——任何人都可以免费下载、修改，甚至拿去做商业产品，都不用再问小米要授权。

这次一共开源了两个模型:

MiMo-V2.5-Pro:偏向写代码和处理复杂任务
MiMo-V2.5:能同时处理文字、图片、声音、视频的"全模态"模型

两个都支持 100 万 token 的上下文——大致相当于一次能"读完"75 万字的内容,几本书的量。

它实际能做什么？

光看跑分意义不大，看两个小米官方公开的真实任务：

1. 用 4.3 小时写完一个编译器

任务来自北京大学《编译原理》课程项目，要求用 Rust 从零实现一个 SysY 编译器。北大 CS 本科生通常要花几周完成。

MiMo-V2.5-Pro 用了 4.3 小时、调用 672 次工具，在隐藏测试集上拿了 233/233 满分。

2. 一句话生成一个视频编辑器

提示词只有一句："构建一个视频编辑器 Web 应用"。

模型自己跑了 11.5 小时，调用了 1868 次工具，写出 8192 行代码，最终交付了一个能用的网页版视频编辑器，包含多轨道时间线、片段裁剪、淡入淡出、音频混合等功能。

<video controls width="100%"> <source src="/uploads/posts/71/786484d4-2785-46d3-9821-db2cad2f490b.mp4" type="video/mp4"> Your browser does not support the video tag. </video> <br>

关键数据

Benchmark

</div>

<br>

Token Efficiency

</div>

几个能直接对比的数据：

项目	数据
GDPVal-AA、ClawEval 评测	开源模型第一
SWE-bench Pro（修真实 GitHub issue）	57.2%（参考：Claude Opus 4.6 为 53.4%）
上下文窗口	1M tokens
Token 效率（ClawEval 同分）	比 Claude Opus 4.6 / GPT-5.4 / Gemini 3.1 Pro 少用 40~60% token

最后一项对实际部署 Agent 的人来说挺重要——同样的活儿，token 花得更少，成本就更低。

自己上手试试

模型权重：Hugging Face 集合
官方博客：mimo.xiaomi.com/index#blog

为什么我不喜欢国产模型

Sat, 25 Apr 2026 00:00:00 GMT

为什么我不喜欢用国产模型

问了一道经典脑筋急转弯——「只用一刀把三个橘子分给四个小朋友」，某国产模型直接回复：「这个问题我暂时无法回答，让我们换个话题吧。」

一道儿童益智题，就这么被和谐了。 <br><br> <div align="center">

DeepSeek

</div> <br>

Claude

</div> <br>

Grok

</div> <br>

ChatGPT

</div>

Deepseek-V4 发布

Fri, 24 Apr 2026 00:00:00 GMT

🚀 DeepSeek-V4 Preview 正式发布 | Official Launch

概览 | Overview

中文： DeepSeek-V4 Preview 正式上线并开源！欢迎进入高性价比、100万上下文长度的新时代。

English: DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length.

模型对比 | Model Comparison

模型 / Model	总参数 / Total Params	激活参数 / Active Params	预训练Token / Pre-trained Tokens	上下文长度 / Context Length	开源 / Open Source	API服务 / API Service	模式 / Mode
DeepSeek-V4-Pro	1.6T	49B	33T	1M	✅	✅	Expert（专家模式）
DeepSeek-V4-Flash	284B	13B	32T	1M	✅	✅	Instant（即时模式）

模型特点 | Key Features

中文：

🆓 完全免费使用
📚 超长上下文（1M tokens），能一次处理《三体》三部曲体量的内容
📎 支持文件上传，可以处理图片、PDF、Word、Excel、PPT 等格式
🔗 可阅读链接内容
🌐 支持联网搜索（需要手动开启）
🎙️ App 端支持语音输入

English：

🆓 Completely free to use
📚 Ultra-long context (1M tokens) — handles the equivalent of the entire Three-Body Problem trilogy in one go
📎 File upload support — images, PDF, Word, Excel, PPT, and more
🔗 Can read link content
🌐 Web search support (requires manual activation)
🎙️ Voice input supported on mobile app

知识截止日期 | Knowledge Cutoff

中文： 知识截止到 2025年5月，是 DeepSeek 家族的最新版本。
English: Knowledge cutoff is May 2025, the latest model in the DeepSeek family.

OpenAI 发布 GPT-5.5

Fri, 24 Apr 2026 00:00:00 GMT

<p align="center"> <a href="https://openai.com/index/introducing-gpt-5-5/">OpenAI官网关于ChatGPT-5.5介绍</a> </p>

🤖 什么是 ChatGPT 5.5？

ChatGPT 5.5 是 OpenAI 最新发布的一次重要升级。简单来说，这次升级让 ChatGPT 从一个聪明的聊天工具，真正变成一个能帮你做实际工作的 AI 助手。

🔄 最大的变化：从"回答问题"到"完成任务"

过去，我们用 ChatGPT 可能只是简单的一问一答，复杂一点的任务需要不断提示和调整。

现在的 GPT-5.5 更擅长理解用户真正的需求，可以主动拆解任务，逐步完成工作。例如：

以前你说"帮我写一份策划"，它可能给你一段不错的文字；
现在它会主动帮你整理预算、做出流程图、分析可能的风险、甚至生成宣传文案，把事情做得更全面。

🧩 更适合复杂工作

GPT-5.5 在处理复杂任务方面尤其突出，比如：

💻 写代码、找 bug、分析项目；
📊 整理大量信息、分析数据；
📄 生成文档、报告和表格；
🔬 辅助商业分析、学术研究。

它可以更独立地跨多个工具完成任务，真正成为你工作和学习中的好帮手。

🏃 不容易"半途而废"

过去 AI 经常会"写一半就停"，GPT-5.5 改进了这个问题。它更懂得如何持续推进任务，不容易中途跑偏或停止，尤其适合长任务或项目型的工作。

🛠️ 更强的工具使用能力

GPT-5.5 不只会"说"，更擅长"动手"：

能帮你直接制作表格，而不是只是告诉你需要一个表格；
能真正读取文件、浏览网页、分析数据，而不是只建议你去做这些事。

⚡ 效率提升，成本更低

虽然能力提升，但 GPT-5.5 的反应速度依然很快，并且在完成任务时用的资源（token）更少。这意味着：

✅ 工作效率更高
✅ 成本更容易控制

👨‍💻 对程序员和办公人士特别友好

GPT-5.5 特别擅长：

帮助程序员写代码、调试、项目管理；
帮助学生和上班族写报告、做 PPT、整理数据、生成预算表等办公任务。

此外，它还有一个加强版——GPT-5.5 Pro，更适合高难度、专业场景。

📝 总结

简单讲，ChatGPT 5.5 不是简单的性能升级，而是让 AI 真正变成一个可以长期合作的伙伴，帮你完成现实中复杂的工作。无论你是学生、程序员、职场人士还是普通用户，它都能帮你做得更多、更好。

对比上代

</div>

ChatGPT Images 2.0 震撼发布

Wed, 22 Apr 2026 00:00:00 GMT

ChatGPT Images 2.0 震撼发布：不仅是画图，它拥有"世界认知"

2026 年 4 月 21 日，OpenAI 正式发布全新图像生成模型 GPT Image 2（ChatGPT Images 2.0）。发布后它在文本到图像生成竞技场（LM Arena）中强势登顶，与前代最佳模型拉开了惊人的 250+ ELO 分差。

这不是一个传统画图工具，而是一个具备**思考级别智能（Thinking-level Intelligence）**与庞大世界知识的全新模型。

我一句话生成的福州旅游攻略长图

同样一句话生成的

</div>

打开ChatGPT后直接点击Create Image就能用了

</div>

核心突破与惊艳功能

1. 独创"思考模式"与世界级认知

GPT Image 2 拥有标准模式与**思考模式（Thinking Mode）**两种生成方式。在思考模式下：

模型在生成图像前会进行深度分析与逻辑规划，甚至主动发起网络搜索以确保内容准确
知识截止日期为 2025 年 12 月，具备强大的现实世界认知能力
可在生成图像的黑板上进行逻辑推导，准确求解复杂数学方程式

2. 叹为观止的文本渲染与 UI 生成

过去 AI 模型在生成文字时往往出现乱码，Images 2.0 彻底改变了这一点：

能力	效果描述
条形码生成	可生成被真实手机扫码仪识别的书籍条形码（如《从优秀到卓越》）
UI 界面还原	完美生成手机 App 截图、网页布局及含图表的长图信息图（Infographic）
密集文本渲染	高精度文字输出，告别乱码与 AI 伪影

3. 极致的一致性、细节与灵活性

内容一致性

多图拼接（如变色龙连续动作序列）
游戏角色全套动作精灵图（Sprite Sheet）
高度一致的漫画分镜脚本

输出细节与规格

最高支持 4K 分辨率，细节精准至每粒米饭的纹理
长宽比支持从 3:1 全景横图到 1:3 竖屏大图，灵活可调
原生支持透明背景（PNG Alpha 通道）输出

4. 逆天的精准图像编辑能力

一句话执行 11 项修改：在测试中，一段包含 11 条独立指令的提示词（杯子换名字、衣服改棕色高领毛衣、戴粉钻耳环、删除背景红牛等）被模型在一次生成中完美像素级执行。

其他编辑亮点：

覆盖标注功能：上传照片后，可让模型用红笔加箭头在图片上批注详细解析（例如解读 80 年代文化梗），手写体批注识别精准

改变工作流：与 AI 智能体深度融合

GPT Image 2.0 已被原生集成进 OpenAI 智能体应用 Codex，图像生成成为 AI 智能体可自动调用的工具。

典型场景：只需一句指令，AI 会自动搜集资料，调用 Images 2.0 批量生成插图，并排版输出包含文字与高质量配图的完整幻灯片，彻底重塑生产力工作流。

当前局限性

尽管能力惊艳，Images 2.0 目前仍有以下不足：

局限	说明
计数能力薄弱	生成上百人并逐一标序时，无法准确处理大量重叠对象
偶发文本瑕疵	复杂排版下偶有 AI 伪影或个别拼写小错
人脸还原偏差	基于照片的人脸替换/变年龄效果良好，但有时有过度精修的"AI 感"

最后

ChatGPT Images 2.0 带来的是一场真正的视觉生产力革命。其世界认知能力、对复杂编辑指令的精准跟随，以及与 AI 智能体的无缝融合，使它不再仅仅是"玩具"，而是设计师、内容创作者和开发者工作流中不可或缺的超级工具。

个人博客在服务器部署遇到的问题

Mon, 20 Apr 2026 00:00:00 GMT

别被开发环境骗了

本地 pnpm dev 跑得飞起，一切岁月静好。真正把站点塞进宝塔 + nginx + PM2 这套组合后，才发现开发环境自动帮你绕开了一堆坑。今晚一次性撞了五个，顺手记一下。

1. 后台所有删除操作一律 403 — Astro 的隐形"防火墙"

症状：本地 admin 随便删，生产上点哪个都是 Delete failed。nginx 日志里是 DELETE ... 403，但我自己 nginx 没写任何 method 限制。

直接 curl http://127.0.0.1:4321/api/admin/xxx -X DELETE，Node 端返回：

Cross-site DELETE form submissions are forbidden

这是 Astro 5 的新默认值 security.checkOrigin: true。它把所有 state-changing 请求（PUT / DELETE / POST form）都当可能的 CSRF，要求 Origin 和 Host 匹配。问题是反代之后 Node 收到的 Host 是 127.0.0.1:4321，Origin 是 https://mydomain.com，两者永远对不上，直接拒。

dev 模式下请求都走本地，看不出来。

修法：

// astro.config.mjs
security: {
    checkOrigin: false,
},

我这边 session cookie 已经是 httpOnly + sameSite=lax + secure，等效的 CSRF 防护已经有了，关掉这层不会裸奔。

2. 国外 API 在国内"活得不太好" — 足迹里填香港就崩

两个典型场景都是同一个病：

countriesnow.space 拿到 "Hong Kong" 后直接 error: true 或非 2xx 返回 → 前端提示 加载行政区失败
Nominatim（OpenStreetMap 搜索）用 "省=Hong Kong + 国=Hong Kong" 搜地址搜不到 → 保存失败

开发时我填的都是"广东省" "东京都"这种标准二级行政区，全绿。实际用户会填港澳台、梵蒂冈、摩纳哥这种"省=国"的地方，两个 API 都不配合。

修法：每一步外部调用都包 try/catch，配合逐级退化：

country + state 查不到 → 用 state + country 拼成 q 再查
还查不到 → 退成只查国家中心点
API 完全挂 → 用国家名本身作为唯一可选政区

另外 API 层的 POST / PUT 原本没 try/catch，错误直接抛出就变成 Astro 的 HTML 错误页，前端 response.json() 解析崩，只能给用户看个泛化的"保存失败"。现在把它们都包起来、返回 JSON error，至少能看到真实原因。

3. 后台删了的文章，前台又活过来了 — git 的一次精准背刺

表现很诡异：后台只剩 1 篇，重建后前台显示 5 篇。多出来的恰好就是我之前删掉的那 4 篇。

时间线：

后台删文章 → .md 文件删掉、DB 记录删掉 ✅
推了点代码要上服务器更新
服务器上 git stash && git pull && git stash drop
重建，前台 5 篇 ❌

git stash 确实把"删了 4 个 .md"这个改动存进了 stash，git pull 拉完以后 git stash drop 直接把 stash 丢了，那 4 个已经被删的 .md 就以 git HEAD 的形态被放回工作区。同时 sync-db-posts.mjs 只做"从 DB 往文件系统写"，不做"清理 DB 里没有的孤儿文件"，于是多出来的就留下了。

修法有两层：

治标：sync-db-posts.mjs 同步完加 prune 逻辑，DB 没有的 .md/.mdx 一律删掉，强制让 DB 成为唯一真相源。
治本：src/content/posts/**/*.md(x) 加进 .gitignore，4 个遗留文件 git rm --cached，以后 git pull 再也不会把后台删的文章搬回来。

教训：任何由后台管理的数据都不该被 git 跟踪。public/uploads/、data/site.db 我一开始就 ignore 了，但 src/content/posts/ 这种历史遗留的"种子文章"混在一起，就漏了。

4. "距离上次编辑：16 小时" — 时区经典坑

刚改的文章，底部显示"16 小时前编辑"。

DB 里 updated 存的是完整 ISO 时间戳（2026-04-20T10:00:00.000Z），但 sync-db-posts.mjs 往 frontmatter 写的时候用的是：

yamlDate(value).toISOString().slice(0, 10)  // "2026-04-20"

直接把时分秒砍了。Astro 读 2026-04-20 时把它当成 UTC 午夜，换算成 UTC+8 就是当天凌晨 8 点——于是不管几点改，显示时间都锚定在当天 08:00，跟"现在"一减最多能差 16 小时。

顺便看了一眼运行时 content-sync/posts.ts，那边一直用的是 yamlDateTime（完整时间戳），两条路径不一致。

修法：prebuild 脚本里 updated 改用 yamlDateTime 对齐运行时。

5. 首页切到文章页会闪一下白色 — CSS 加载竞速

Swup 做 SPA 切页的时候，新页面的外链 variables.css 偶尔比 DOM 替换慢一拍。那一瞬间 CSS 变量全都读不到默认值，--page-bg 退化成白色，整个深色主题闪一下浅色再恢复。

本地基本看不到，因为 Vite 缓存热得一塌糊涂，CSS 永远先到。

修法：把最关键的 :root / :root.dark / body.wallpaper-transparent 变量直接写进 <style is:inline>，每页的 HTML 都自带一份，无论外链什么时候到，关键变量一定在。

总结

Dev 环境跟线上差的不只是"慢一点"：

类别	dev 不会暴露
安全策略	CSRF、CSP、SameSite cookie 在本地 127.0.0.1 全部无感
网络环境	国外 API 在国内的超时 / rate limit / 直接返错
部署流程	`git pull` / `stash` / `pm2 reload` 任何一步都可能搅乱运行时状态
资源加载顺序	冷缓存 + 弱网络 = CSS 比 HTML 晚到
时区	服务器 UTC、浏览器本地、数据库 ISO 三者对不齐

以后上线前至少过一遍：

反代后起一个真实环境（哪怕本地跑 nginx）
用慢网络 profile 切几次页
admin 的"增改删"各做一次完整回放，重建 + 刷新都看一眼
把所有会被运行时写入的路径都 ignore 掉，别留在 git 里

代码写完跑通只是开始，真正的 debug 是从它跑在别人电脑上那一刻开始的。

Xuwei.dev

欢迎来的我的博客

欢迎来到我的博客 🎉

这里会有什么？

关于我

LLM 和 AI Agent 到底有什么区别？

从 Grok 接入 Hermes Agent 聊起：LLM 和 AI Agent 到底有什么区别？

🧠 1. LLM 是什么？

🤖 2. AI Agent 是什么？

🔗 3. 用 Grok × Hermes 事件来理解

💡 4. 一个简单类比

⚖️ 5. LLM 和 AI Agent 的核心区别

🚀 6. 为什么 AI Agent 会变得越来越重要？

⚠️ 7. 但 AI Agent 不是万能的

🎯 8. 总结

网站优化日志

起因

一张图直击问题所在

优化措施

字体直接“清零”

音乐改为用户点击后再加载

用户上传图片统一通过 Sharp 优化

图片尺寸精确按需调用

全屏壁纸单独使用更小尺寸

Banner 图使用懒加载

优化前后对比

网站海内外分流

起因

整体架构

三个关键注意点

一、ICP 备案是硬性要求

二、DNS 提供商必须支持线路分流

三、缓存策略与回源规则明确区分

性能提升数据

百度文心大模型 5.1 发布

百度文心大模型 5.1 发布

排名表现

什么是 GPT？它和 ChatGPT 是一回事吗？

🤖 什么是 GPT？它和 ChatGPT 是一回事吗？

What is GPT? Is it the same thing as ChatGPT?

🔍 1. 拆解 GPT：它的名字里藏着三个秘密

1. Breaking Down GPT: Three Secrets Hidden in the Name

⚙️ 2. GPT 是怎么工作的？（一场高端的文字接龙）

2. How Does GPT Work? (A High-End Word Game)

🚗 3. 一个误区：GPT 不等于 OpenAI

3. A Common Myth: GPT Does Not Equal OpenAI

⚠️ 4. 警惕：它有时也会"一本正经地胡说八道"

4. Warning: It Sometimes "Talks Nonsense with Confidence"

📝 总结 / Summary

GPT-5.5 Instant 发布：Instant 跟 Thinking 模型的区别

GPT-5.5 Instant 发布：Instant 跟 Thinking 模型的区别

Instant 和 Thinking 模型有什么区别？

AI即将接管编程

AI即将接管编程？Anthropic CEO表示一年内AI将写100%的代码

未来的编程：工具配置能力至关重要

如何应对AI时代的变化？

结语

博客故障排查报告

博客故障排查报告

起因

根因

修复

小米 MiMo-V2.5 开源了

小米MiMo-V2.5系列开源了

它实际能做什么？

1. 用 4.3 小时写完一个编译器

2. 一句话生成一个视频编辑器

<video controls width="100%"> <source src="/uploads/posts/71/786484d4-2785-46d3-9821-db2cad2f490b.mp4" type="video/mp4"> Your browser does not support the video tag. </video> <br>

关键数据

自己上手试试

为什么我不喜欢国产模型

为什么我不喜欢用国产模型

Deepseek-V4 发布

🚀 DeepSeek-V4 Preview 正式发布 | Official Launch

概览 | Overview

模型对比 | Model Comparison

模型特点 | Key Features

知识截止日期 | Knowledge Cutoff

相关链接 | Links

OpenAI 发布 GPT-5.5