跳至主要內容
Menghuan1918的个人博客

Menghuan1918的个人博客

一个普通的大学生,目前在学习计算机相关知识,喜欢折腾各种东西。

将PDF知识图谱化:graphrag+Doc2X+DeepSeek

巨硬最近新出了个 graphrag ,号称其能提取有意义的结构化数据,不过遗憾的是默认情况下其只能读取txt或者csv数据。这次就让我们用我搓的外部库pdfdeal将PDF转换为带格式化的txt,再结合更便宜的deepseek进行构建。


Menghuan1918大约 17 分钟SoftwareLLMLinuxSoftwareDocker
如虎添翼:为gpt_academic配置searxng搜索

使用gpt_academic + searxng搜索,进行网页或者学术论文的快速检索。实验下来使用超级便宜的deepseek-chat也能有相当好的效果。不过由于要处理的文本量偏多,原版的llama3处理这种任务就有点力不从心了,可能需要使用上下文更大的本地模型才能有更好的效果。


Menghuan1918大约 3 分钟SoftwareLLMLinuxSoftwareUbuntuDocker
包管理工具UV使用指南:全面替代conda

UV,作为新一代的,性能极佳的Python的包安装器和解析器,其网上中文教程却寥寥无几...

由于其目前并不支持自行下载多版本的Python,这篇文章记录下我借用conda的多版本Python支持,与uv结合,使得能实际使用中完全替代conda。

也算半个UV使用教程了把(大概)。


Menghuan1918大约 4 分钟SoftwarePythonLinuxWindowsSoftware
Ollama跨平台性能比拼:Windows遥遥落后

Ollama + llama3-8B基本可以满足基本的翻译工作了,并且其也能 流畅 地在我的残血3060M上运行。当然,正如标题所言,这个流畅的前提是不在Windows下运行。


Menghuan1918大约 2 分钟SoftwareWindowsLLMSoftwareArchOllama
笔记软件的最终选择:Obsidian + Self-hosted LiveSync

其实标题也不怎么准确,应当是说,主要的笔记现在都是使用Obsidian写,但是部分需要手写的笔记依然是在使用OneNote编写。毕竟Obsidian并没有官方的手写支持。

而Self-hosted LiveSync配置的难点在于HTTPS(以及域名),没有HTTPS的话移动设备可能不能同步。不过幸运的是,使用(免费版的)tailscale,不需要域名以及公网IP即可完成这一切!


Menghuan1918大约 3 分钟SoftwareRaspberrypiLinuxDockerSoftware
配置DOSBox以及其窗口大小

DOSBox默认情况下的窗口大小是由像素大小指定的,对于现代的屏幕而言稍微有亿点偏小了。并且其窗口还不能进行拖拽调整,虽然可以使用alt + Enter将其切换为全屏模式,不过考虑到效率问题还是调整其窗口大小更好一点。


Menghuan1918大约 2 分钟LinuxWindowsLinuxSoftwareArchUbuntu
在VSCode中配置多平台的C/C++语言支持

这么多年的(插件)发展之后,实际上在VSCode中配置C/C++语言已经不是一件很困难的事情了,一般而言,所需要做的仅仅是安装C/C++插件,理论上其会自动检测编译器并生成响应的配置文件。

当然这只是理论,一旦涉及到跨平台同步(例如自带的设置同步,或者共用一个文件夹)就麻烦起来了,因为Linux和Windows的设置并不通用。此外微软开发的C/C++插件还存在一些问题,例如只会显示错误(Error)不会显示警告(Warning)等等,不过好在VSCode的众多插件提供了解决方案,其即能跨平台同步设置又补足了之前的缺点,同时在WindowsLinux下使用起来简单快捷。


Menghuan1918大约 3 分钟SoftwareWindowsVSCodeUbuntuSoftwareArch