win11
docker 部署 milvus 2.4.4
MongoDB 7.0.11 Community
neo4j desktop 5.20.0(apoc插件)
umi-ocr
requirement.txt (python 3.10、torch 2.3.0 + cu121...)
.env # 大模型api
LLM4KG.ipynb # 生成知识图谱的代码
upload_file_mongodb.ipynb # 上传文件到知识图谱的代码
database/resource # 存放待上传到知识图谱中的文件
databse/课程/part_textbook # 教材的 word 文件(多个)
databse/课程/part_keywords/all_keywords.txt # 手工提取的教材关键词文件
database/pdf2img # 识别 pdf 文本时,先转成图片,再用 ocr
output # 里面存放中间 json、txt 文件
- 启动相关服务
- 运行 LLM4KG.ipynb 基于教材文档在 Neo4j 中生成知识图谱
- 运行 upload_file_mongodb.ipynb,将文件资料作为节点上传到知识图谱