文本相关度分析助力学习与笔记
项目地址:https://github.com/draJiang/flomo-linker(flomo 获取笔记的方式已经失效,项目待更新,以下作为一种思路参考)
文本相关度,顾名思义,就是可以对比两段文本的相关程度。
接下来分享一个案例,介绍文本相关度分析在学习、记笔记场景下的应用。
使用卡片笔记快 1 年,实践下来感受非常不错,帮助完成了许多启发和学习收获,但过程中也存在一些困难。
S 情境
卡片笔记发挥作用的关键原则是建立卡片与卡片之间的链接(双向链接),新笔记(新知识)和旧笔记(已有知识)链接,新知识加入已有的知识体系才算真正的理解并在未来有机会辅助实践。
所以每次新建笔记后,与已有笔记完成链接是一个重要的环节。
目前的流程是靠大脑回忆是否存在相关的笔记,而人脑由于记忆力等原因,总是会存在缺漏。
T 任务
受到少数派文章的启发,思考能否利用文本相关度分析做一个工具,在新建笔记之后自动推荐一些相关笔记辅助链接的建立,由于在用 flomo 践行卡片笔记法,所以要基于 flomo 搭建工具。
A 行动
前端部分,利用 React 框架和蚂蚁组件快速完成了交互界面的搭建;为了防止意外造成笔记数据的丢失(写到一半浏览器奔溃)异常,本地做了实时的数据存储,让笔记记录更有安全感。
后端部分,由于 flomo 没有开放的 get api 所以通过爬虫获取所有笔记数据,再用 Python 的 gensim 插件构建基础数据用于后续的相关度分析。
gensim 的功能可以简单理解为输入两句话,它将分析相关度,并以一个 0~1 的小数显示,越接近 1 相关度越大
R 结果
完成了一个简单的卡片笔记关联工具,在输入框输入笔记后下方将显示可能存在关联的笔记,帮助用户完成线索的链接和思维的发散。日常已经在使用,的确可以帮助笔记之间完成链接。
关于工具的忧虑,和以下网友的相同:
担心依赖机器算法推荐,更难去主动做一些复习和整理。不过先用着吧 😄