Skip to content

茶馆留档使用指南

这是什么?

这是一个自动记录里茶馆内所有发帖、回帖数据的项目。该项目的数据来源于一些自动化的魔法,关注结果即可。

如何组织文件

本项目有用的东西是一个文件(index.csv)和一个 文件夹(Data) (目前仓库的Data目录因为Git的文件体积限定会逐步移除)

其中index.csv文件存放的是本项目记录到的数据的索引,索引包括帖子标题和帖子的tid(后面的一串数字,查询要用)。

Data文件夹内存放的就是每个帖子自动记录到的数据,每一个文件夹就代表了一篇帖子,进入文件夹就能查看帖子的内容。

如何使用本项目的数据

  • 请准备一个markdown阅读器。
  • 请完全下载本项目。可以是clone,可以是zip下载。
  • 这个项目很简单,其中index.csv是本项目的索引,在其中您能查看到本项目记录的所有主题,以及它的tid。
  • 当您确认您要查询的楼层后,请使用window的资源管理器的搜索功能,搜索该tid,定位到该文件夹。
  • 随后打开该文件夹,寻找一个后缀为 .md 的文件(例如叫post.md),用markdown阅读器打开它,查阅帖子。

如果我不确定我要查询的帖子的标题或者tid该怎么办?

进行模糊搜索.答案是利用window的powershell脚本,通过powershell可以完成关键字筛选、上下文披露、按时间按关键词按发帖id查询等高级操作。

千万不要认为这总方法很复杂,大多数情况下您只需要询问bing、gpt等聊天机器人,描述请您的需求,它们就会帮你编写好脚本

本项目的局限性

  • 本项目只能记录通过审核的发帖、回帖,对于没有通过审核的内容无能为力。

  • 对于变更频繁的(例如刚发出来版务就锁了的)帖子,如果变化快于本项目的自动扫描时间,本项目也无能为力。

Released under the MIT License.