avatar

zhu‘s log

你怎么发现这里的?

  • 首页
  • 关于
Home 260316一周废话文学
文章

260316一周废话文学

Posted recently Updated recently
By zhuth
15~19 min read

星期一

其实越来越感觉到状态好起来了。昨天称了体重,还是有所长胖,稍微回到有所控制的时期再加上有氧就行了,半小时有氧也很厉害了

今天继续修改简历,cesium和爬虫项目还是有一些可以改进的增长点,另外找实习得找到一份能体现在简历上的不然不就白给了么哈哈。dll怎么接入也是个问题

  • 试一下playwright-cli,省一下我的token

今天继续有氧一下,但是要早去,毕竟和茜茜总约了吃饭。以及周末可以爬山或者郊游或者看花去了,非常愉悦,自驾也可以

  • 夏天了,该准备调研一下冰柜的采买和使用了(二手最便宜,品质这一块直接考虑车载平柜英得尔)

  • openwebui层面上也可以继续学习,文档提取方案+工作区设定(顺便修改了一下返回chunk的最大值设置,防止弄了半天不接受了,钱白花了)


星期二

昨天晚上约了饭,感觉很愉快,不过总结不出来什么东西TAT 要不我也没事相亲一下吧

精神不错,有很多想学想做的事情了,但是也要警惕春天带来的躁狂压力

找一下实验室的硬盘在什么地方,硬盘盒子。但是似乎该有的也都在我自己的硬盘里面了?

  • 学习一下常见优化技术在python中的实现,找找合适的包什么的

  • 可以考虑强化cesium的学习(比如接入浏览器调试接口,让gemini来看着操作写前端),以及看一下怎么融入dll或者C的后端,以及和python的联动。matlab则是能不用就不用了

  • 自动化的cookies管理这一块

  • 考虑给简历更新一下字体,然后看看想投的单位,要开始联系了

昨天晚上了解了一下reality的技术要领之类的,但是感觉高峰期间网速慢这始终是个问题,这方面可能还是需要好的线路比如cn2什么的

调研一下文档文本解析工具,用于oui使用。另外再考察一下是不是必须引入RAG。总之不要使用默认就对了,可能有内存溢出

  1. tika 老牌文件解析,已经集成在openwebui之中

  2. Docling 也是有AI介入的,看论文这方面直接选用MinerU是最好的,去除页眉页脚,识别能力强。

了解到oui甚至有很多scale自建内容,主要就是可以更换数据库PostgreSQL,

在oui上试试里面的code interpreter,就随便画个图什么的,顺便看一下code执行是不是调用了,以此来看是不是支持了native的response调用。(check,matplotlib就不打开执行,就直接写好了然后用就行了)(如果要嵌入自动化使用比如说求方程的解这样的问题,那么直接用native调用即可)

  • 本月超过20刀很有希望,研究一下plus如何接入到自己的webUI里面,OAuth的原理这一块。(官方认可了一个导入chatgpt历史对话的思路)


星期三

好吧,今天本来说休息的,但是感觉还是去做做运动比较好,尤其是山羊挺和跪姿俯卧撑

可以等那些团课都下课了以后去

openwebui的使用和贡献:

  1. 想把matplotlib画出来的图直接加到对话上下文之中,这样方便提问方便修改,就像在使用nano banana一样。(都已经有代码了,所以直接看代码不比直接看图来的更好??)

  2. 考虑OAuth接入使用,就,登录,然后,用。(check)

  3. (新增)考虑加入defuddle支持,可能只需要很少的代码修改就行(check)


星期四

考虑在webui中引入defuddle支持,好用爱用

调研了一波,发现其实使用井号可以直接引入网页内容,稍微方便一点,如果是想手动的话就加上defuddle.md,或者现在已经配置好了tavily,每月额度肯定支持使用了,效果还行。

openwebUI的集成真的有很多可以做,有的做成了有的没做成。

minerU还是这么给力,就是稍微有点自己的广告了,也行吧,一个国家级实验室算是做出很好的东西了,我非常支持甚至想来点赞助。minerU的设置在文档里面也写的很清晰,支持的自定参数什么的,直接写就行。

调研了一下转发订阅的,貌似有好几个,关键词使用chat2api就行,就是相当于使用一个网关,然后token从网页上也就能直接拔下来。但是现在的问题就在于不太想被绑定在一家上,所以看起来还可以继续保持我openrouter的使用,或者直接去买api代理,或者使用更便宜的国产模型作为日用。

  • 在进行买船优化的过程中使用了0-1整数规划,考虑让ai辅助然后学习使用python求解这样的问题。fit 旅行商问题,多目标决策0-1规划问题

此外今天还健身了,说明昨天跪姿俯卧撑做5个最多纯属废物,真能做很多个的

  • 简历做好了真得往外扔吧,我觉得明天就得做这个事了

之前觉得不良林在油管上的视频都好高级好高深,实际上踏马不如AI解释的一根毛,现在再去看他的内容简直觉得是太菜了


星期五

睡觉,休息


星期六

正常摸一下wws的三箱子

要去健身,周末可能还是要安排一下有氧吧,或者看看练背的人多不多

调研两款PS的替代工具(check,没用)

在oui中的openapi和restful的工具使用(主要是针对defuddle的,但是在服务器端好像有滥用屏蔽,所以无所谓)

进一步规范仅聊天模型的动作可预见性(check,简单来说就是少用原生模式,用原生模式只打开可能需要的工具,其余的不要开)

部署本地的tika(check,落后时代,就用minerU就是最好的)

梳理一下oui之中和文件有关的概念:

RAG: 分为知识库和附件文档,都在管理员面板的文档下面进行设置,主要控制分块和embeding模型

内容提取(引擎):对上传的文档文件修改转换为md文本。

文件上传:在管理员面板-模型-功能设置。上传原始文件,在配置了response API的前提下,使用provider方面的能力配合模型使用。其实发过去也是向量化和检索那一套,但是细节上可能有些优化什么的。会运行文件解析工具,生成文本或者md

文件上下文:在管理员面板-模型-功能设置。不管开启还是关闭,都将对上传的文件应用切分和embedding。对话框里面会变成使用完整上下文,然而并不会把附件跟随到上下文发送出去。迷惑设定,我不明白为什么会有这么弱智的选项。哦,可能是为了配合response API使用。或者是全交给模型内置工具调用和检索数据库或者文件。

完整上下文:当文件上下文打开的时候,默认使用聚焦检索,当只上传文件并解析后,默认为完整模式。在文件对话框里开启,会把解析结果全放在上下文里,但是仍然不会跳过embedding的步骤;在管理员面板-文档里面打开,则会关闭切块和embedding(对网页好像没反应,算是个bug可能)。

聚焦检索:表示使用分块和embedding,但分块和embedding的动作是在前面就做好的,不是在这一步控制的。

读取知识库的内置Tools:在传统RAG的基础上,可以由模型自主决定需要搜索的内容和调用的数据库

知识库:对于需要频繁使用的对话文件,保留embedding模型运行后的向量数据库到本地,从而形成文件知识库

关键:到底什么时候使用RAG?RAG的优势和劣势?如何扬长避短?

推荐设置:使用绕过切分和嵌入。直接把完整文件上下文注入到模型上下文里

RAG本质还是搜索,对于特别精确的内容有很好的效果,比如在又臭又长的合同或者说明书里面找到对应的话。然而在需要LLM理解的时候,RAG反而帮倒忙。建议使用RAG的时候全用人工检索。

总结一下oui的工具调用:

使用默认模式,则除非用开关指定了要使用的工具,否则根本不会调用工具,也不会带来额外的提示词和token消耗。但是如果此时真的调用了工具,那么就会引入额外的不可见的内置prompt并且会摧毁上下文缓存。

使用原生模式,则内置工具全是默认打开的,会加在context的最顶端,每次对话的时候作为历史信息都会发送。虽然可以在更高层面上控制相关功能的开启或关闭,但是tools description还是会加入进入造成token的浪费。所以从context engineerring和token节约的角度来看,应该精细调整。


星期日

锻炼,练了俯卧撑,三头,二头,山羊挺身,但是都有点划水属于是

觉得应该猛猛摄入蛋白质了,我真要开始调研蛋白粉了。

总摄入量,先定一个5.5勺,140g每日,每勺30g按照蛋白质25g计算。相当于1.6g * 84kg,一个稍微保守一些的量。或者4.5勺到5勺。最少也需要100g蛋白质,这是减脂最低标准,相当于4勺。

然后

1个大鸡全腿 相当于1.5勺

2两熟牛肉 相当于1.2勺

3个大鸡蛋或4个小鸡蛋 相当于1勺

330ml牛奶 相当于不到0.5勺

其他食物保底摄入0.8勺

先按照5勺总量执行!还剩4.2勺

一个煎饼3个鸡蛋1勺,1个鸡大腿1.5勺加一起2.5勺,还差1.7勺

练后一勺,半个鸡腿算不到一勺,完美。


总结一下现在oui上运行的api提供的服务

serapi 谷歌搜索网页搜索

minerU 文档pdf等解析

tavily 网页抓取解析(手动则使用defuddle)

openAI embeddings RAG向量化工具

openrouter:online exa原生网页搜索工具

openrouter 基本LLM api

家用宽带代理 api,垃圾,别用

还剩1.7勺,可以练后1.5勺,或练后1勺然后吃点别的肉。

License:  CC BY 4.0
Share

Further Reading

OLDER

260309每周废话文学

NEWER

Recently Updated

  • 260316一周废话文学
  • 260309每周废话文学
  • claude code学习配置札记
  • 260301新阶段
  • 20260218年初二做事一些总结

Trending Tags

Halo

Contents

©2026 zhu‘s log. Some rights reserved.

Using the Halo theme Chirpy