NEW:训练了新的模型，LSF-Net(暂未开源)。舍弃之前的程序框架，将TensorRT构建/推理等进行封装，实现高效的工厂模式。

2024/10/16

USB摄像头0实时采集图像，python通过opencv的gstreamer接口拉取视频流，再写入共享内存（加入信号量和互斥锁）

 --数据格式： 3 x 16 x 112 x 112

 --进度1： tensorrt.cpp读取engine模型文件,使用模型进行推理（到创建buffer）

 --进度2： image_pretrain.cpp 访问共享内存，将图片数据映射到本地，使用std::vector<cv::Mat>存放。

2024/10/17-v1

可以实现拉取视频流到推理全过程，但是推理结果不正确，考虑是视频流拉取的问题，没有获取到真正实时的共享内存中的数据。

 --调试1： 将获取到的图片保存到本地查看，结果全是黑色（正则化之后未将数据乘回去）
 --调试2： 图片显示黑白色的九宫格样子
 --调试3： 图片维度错了，改成112 x 112 x 3图片数据问题解决了。

2024/10/17-v2

可以从共享内存中读取并保存图片，正常显示。但是推理结果不好，基本都是一个结果就是数值大小不同。

 --调试1： 考虑还是图片数据维度不对，虽然保存后可以正常显示，但是这里图片的维度是（32x112x112x3）而模型要求输入的是（32x3x112x112）

2024/10/18-v1

 --调试1： opencv获取到的图像是16*112*112*3的，在送入推理引擎之前，把图像数据转成3*16*112*112（模型要求的输入），在数据没大问题的情况下（摄像头采集角度，采集时间）
           推理结果似乎能看出来是正确的。
 --调试2： 摆正角度并且把控好时间，准确率不错，目前问题是分类器的激活时间很难把控，解决方案是加一个软件开关，用来捕获手势动作的开始。

2024/10/22-v1

 --调试1： 修改了TensorRT推理引擎的定义，封装成了一个类，可以支持各种不同的模型输入以及输出。
           可以连续进行手势检测器和手势分类器的任务，暂未整合在一起。预设计两个进程，相互激活。

2024/10/23-v1

 --调试1： 增加了Params.h,封装了线程参数结构体，定义了分类名称字典。
 --调试2： 将检测和分类分为两个线程，检测到手势，用条件变量通知手势分类线程，共享内存的方式通知python进程。
           python进程判断到检测到手势，改为写入16帧（原来是2帧）。
 --未解决问题1：未做到同步，当python进程接收到检测到手势信号，当前写入帧数暂未改变，但是分类线程预接收图像帧数已经改变
               造成报错。
 --未解决问题2：共享内存的方式通知不知道效率和实时性如何，python中检测到手势之后写入帧数不是单次改变，而是一直改变。

2024/10/24-v1

基本完成实时检测和分类任务，检测到手势后存储后16帧图像，单次激活分类器进行动态手势分类。但是分类效果不好，训练出的模型鲁棒性不好。

 --问题解决： 检测到手势之后将线程挂起一段时间，再等待分类完成。 
              将手势检测和手势分类分为两个共享内存，因为所用到的空间大小不一样

NEW:训练了新的模型，LSF-Net(暂未开源)。舍弃之前的程序框架，将TensorRT构建/推理等进行封装，实现高效的工厂模式。

2025/3/24-v1

将各个组件封装完成，程序还未编译过。

2025/3/27-v1

将新的模型，转成engine。用的py脚本，c++的代码转新模型(ONNX->engine)会发生段错误，还没找到原因.有可能是工作空间设置等原因

 -- 用trtexec 测试（激活环境变量export PATH=/usr/src/tensorrt/bin:$PATH），开启 CUDA Graph（trtexec --loadEngine=gesture_7classification_model_MEMATsmv1-fp16.engine --useCudaGraph ）。  测试推理速度达到40FPs以上。

2025/4/2-v1

程序编译通过，解决了一些报错,如在main中加入插件初始化否则报未找到插件的错误。

 —- 未解决： 前处理图像格式转换还是4维的，要改成5维(改cuda核函数)。
 -- cuda核函数还没链接到该工程，现在直接链接会报错，可能是CMakeLists.txt配置不恰当？

2025/4/3-v1

前处理暂时用的CPU，整体程序已经可以运行，可以进行实时检测。

 —- 未解决：检测时间较长，需要优化。
 -- 检测出来的结果不是预期的，怀疑图像处理部分仍然存在问题，且推理过程的inputmemory和outputmemory似乎没正确配置。

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
.vscode		.vscode
OptmiziePrj		OptmiziePrj
QT		QT
include		include
py_file		py_file
src		src
.gitignore		.gitignore
CMakeLists.txt		CMakeLists.txt
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

2024/10/16

USB摄像头0实时采集图像，python通过opencv的gstreamer接口拉取视频流，再写入共享内存（加入信号量和互斥锁）

2024/10/17-v1

可以实现拉取视频流到推理全过程，但是推理结果不正确，考虑是视频流拉取的问题，没有获取到真正实时的共享内存中的数据。

2024/10/17-v2

可以从共享内存中读取并保存图片，正常显示。但是推理结果不好，基本都是一个结果就是数值大小不同。

2024/10/18-v1

2024/10/22-v1

2024/10/23-v1

2024/10/24-v1

基本完成实时检测和分类任务，检测到手势后存储后16帧图像，单次激活分类器进行动态手势分类。但是分类效果不好，训练出的模型鲁棒性不好。

NEW:训练了新的模型，LSF-Net(暂未开源)。舍弃之前的程序框架，将TensorRT构建/推理等进行封装，实现高效的工厂模式。

2025/3/24-v1

将各个组件封装完成，程序还未编译过。

2025/3/27-v1

将新的模型，转成engine。用的py脚本，c++的代码转新模型(ONNX->engine)会发生段错误，还没找到原因.有可能是工作空间设置等原因

2025/4/2-v1

程序编译通过，解决了一些报错,如在main中加入插件初始化否则报未找到插件的错误。

2025/4/3-v1

前处理暂时用的CPU，整体程序已经可以运行，可以进行实时检测。

About

Uh oh!

Releases

Packages

Languages

BBsangAI/Optimize_TensorRTPrj

Folders and files

Latest commit

History

Repository files navigation

2024/10/16

USB摄像头0实时采集图像，python通过opencv的gstreamer接口拉取视频流，再写入共享内存（加入信号量和互斥锁）

2024/10/17-v1

可以实现拉取视频流到推理全过程，但是推理结果不正确，考虑是视频流拉取的问题，没有获取到真正实时的共享内存中的数据。

2024/10/17-v2

可以从共享内存中读取并保存图片，正常显示。但是推理结果不好，基本都是一个结果就是数值大小不同。

2024/10/18-v1

2024/10/22-v1

2024/10/23-v1

2024/10/24-v1

基本完成实时检测和分类任务，检测到手势后存储后16帧图像，单次激活分类器进行动态手势分类。但是分类效果不好，训练出的模型鲁棒性不好。

NEW:训练了新的模型，LSF-Net(暂未开源)。舍弃之前的程序框架，将TensorRT构建/推理等进行封装，实现高效的工厂模式。

2025/3/24-v1

将各个组件封装完成，程序还未编译过。

2025/3/27-v1

将新的模型，转成engine。用的py脚本，c++的代码转新模型(ONNX->engine)会发生段错误，还没找到原因.有可能是工作空间设置等原因

2025/4/2-v1

程序编译通过，解决了一些报错,如在main中加入插件初始化 否则报未找到插件的错误。

2025/4/3-v1

前处理暂时用的CPU，整体程序已经可以运行，可以进行实时检测。

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

程序编译通过，解决了一些报错,如在main中加入插件初始化否则报未找到插件的错误。

Packages