AI新进展+碎碎念20250417
家庭宽带真与假
判断了一些,我的几个廉价梯子vps都是数据中心IP,菜的抠脚,不过也正是这样才使得我能低价持有这些服务……本来就是VPS,就是用来挂服务的,就应该是服务器级别的应用,反而讨论IP是否纯净是最没用的事情。
AI发展最新现状与形式
OpenAI最新O3模型和O4-mini能力情况
O3需要验证才能用API,很可笑
鉴定为没活儿了,基础模型的提升效果很有限,并且专一能力性能就用o4-mini级别的就可以了,论综合性大规模的应用还得是O3级别的。说归说,我也没这么多钱去用O3……我真的很怀疑OpenAI能不能挣到钱。而且最近的几次对比都是跟自己,不仅谷歌处于不败之地,看起来连claude都打不过……
多模态模型到多功能模型与工具的自主调用
也可以说是没活儿了,只能从2B和2C下手
比如新出的O3会自动联网搜索,自动增加代码执行
新的4.1和O系列都强化了Agent应用相关的内容,代码生成和运行、fuction call、格式化xml和json输出、联网搜索、文件rag和搜索增强,当然了,还有电脑的操作能力,这个能力还不怎么强。也就是这些应用端的底层现在也被模型厂商拿过来用了。有人称这种变化是成为了Agentic的。
其实这种肯定是增加了MoE的部分的,也就是会主动选择激活什么子模型。
另外最近大模型应用性最强的就在于编写代码上面了,cline(vs code插件)、cursor、copilot、windsurf等等等一堆乱七八糟的内容。都成为了跑分的最新目标,以及应用侧厮杀最狠的战场。
关于无形的大手
反正在淘宝上已经都搜不到OpenAI的代充值或者成品账号之类的内容了,可能来自对于知识产权的尊重,或者是出于贸易战的考量,再或者是出于对保护国内国产模型的保护。
Openrouter聚合平台
很好,谷歌不给充钱,claude直接封号,再加上亚马逊也ban我,最后还是来到了最大最靠谱的Openrouter平台。
收费是+5%,我觉得相较于风险衡量,算是非常良心的了。毕竟我在野鸡yeka平台上消费也是3.5%,而且没有网络环境要求。
碎碎念
chatgpt的这一波属于是工具属性和聊天属性分割完了,可能是觉得更有人味儿的聊天模型只需要微调一个chatgpt的4o就可以了,没必要上4.5,更不需要4.1或者别的更面向工具和Agent的模型吧
另外明确说了,不要喝酒,不要喝咖啡还有一切会让你兴奋的东西,都不要喝。