巨硬最近新出了个 graphrag ,号称其能提取有意义的结构化数据,不过遗憾的是默认情况下其只能读取txt或者csv数据。这次就让我们用我搓的外部库pdfdeal
将PDF转换为带格式化的txt,再结合更便宜的deepseek进行构建。
使用gpt_academic + searxng搜索,进行网页或者学术论文的快速检索。实验下来使用超级便宜的deepseek-chat
也能有相当好的效果。不过由于要处理的文本量偏多,原版的llama3
处理这种任务就有点力不从心了,可能需要使用上下文更大的本地模型才能有更好的效果。
UV,作为新一代的,性能极佳的Python的包安装器和解析器,其网上中文教程却寥寥无几...
由于其目前并不支持自行下载多版本的Python,这篇文章记录下我借用conda的多版本Python支持,与uv结合,使得能实际使用中完全替代conda。
也算半个UV使用教程了把(大概)。
记录下运用Dify + xinference + ollama打造带重排序(Rerank)步骤的知识库问答,更好的是----即使在我的3060M上其也能完全本地运行并有不错的效果!3060M本地运行llama3-9B
的生成速度参照前文。
本文内容:
- 部署一个网页在线状态面板到子域名
- 将网站反代服务切换到Caddy
其实标题也不怎么准确,应当是说,主要的笔记现在都是使用Obsidian写,但是部分需要手写的笔记依然是在使用OneNote编写。毕竟Obsidian并没有官方的手写支持。
而Self-hosted LiveSync配置的难点在于HTTPS(以及域名),没有HTTPS的话移动设备可能不能同步。不过幸运的是,使用(免费版的)tailscale,不需要域名以及公网IP即可完成这一切!
DOSBox默认情况下的窗口大小是由像素大小指定的,对于现代的屏幕而言稍微有亿点偏小了。并且其窗口还不能进行拖拽调整,虽然可以使用alt + Enter
将其切换为全屏模式,不过考虑到效率问题还是调整其窗口大小更好一点。
本文内容:
- 部署Alist网盘服务到二级网址
- 优化网站生成流程
- 使用tailscale加快SSH速度
最近在玩《ATRI -My Dear Moments-》,然而其设计画质居然是720P,UI等等都没有对更高画质匹配 这明明是2020年的游戏喂!。再外接一块2K屏幕(2560x1440)实在忍受不了,于是想起来是否能强制将其通过某种方式更为清晰化一些。最终借助一些工具强制应用FSR对窗口进行放大。
本文内容:
- 使用Docker部署RustDesk中续
- 解决阿里云上docker-compose的依赖版本问题
- 切换网站框架为为vuepress