Skip to content

InTheFuture7/LLM4KG

Repository files navigation

基于大模型 api 生成课程知识图谱

环境配置

win11

docker 部署 milvus 2.4.4

MongoDB 7.0.11 Community

neo4j desktop 5.20.0(apoc插件)

umi-ocr

requirement.txt (python 3.10、torch 2.3.0 + cu121...)

文件层级

.env # 大模型api

LLM4KG.ipynb # 生成知识图谱的代码

upload_file_mongodb.ipynb # 上传文件到知识图谱的代码

database/resource # 存放待上传到知识图谱中的文件

databse/课程/part_textbook # 教材的 word 文件(多个)

databse/课程/part_keywords/all_keywords.txt # 手工提取的教材关键词文件

database/pdf2img # 识别 pdf 文本时,先转成图片,再用 ocr

output # 里面存放中间 json、txt 文件

运行

  1. 启动相关服务
  2. 运行 LLM4KG.ipynb 基于教材文档在 Neo4j 中生成知识图谱
  3. 运行 upload_file_mongodb.ipynb,将文件资料作为节点上传到知识图谱

About

基于大模型 api 生成课程知识图谱

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published