产品经理入门:图像识别的标签训练

     分类 [产品经理]
2024/7/8 11:38:37 浏览量  1547 喜欢  64
导读:一个医学图像识别案例

产品经理入门:图像识别的标签训练

 

图像识别算法现在已经有很多开源的,但在特定业务下仍然需要企业自己通过开源模型进行训练,获得对应业务领域的标签合集。

 

比如做医学的五官患者面部的疾病识别,我们从数据采集到图像算法建立,可以分为3个步骤。每个步骤产品经理输出的产品设计方案是有非常大的区别。

 

那些打算加入图像识别领域的产品经理,搞清楚产品经理的智能与分工,定义清楚输出的产品设计方案。

 

1.数据采集

 

数据采集是产品经理提供一套可以获得图像源数据的产品设计方案,比如在医院场景里,想通过图像识别某个患者病症,就需要收集到对应患者的原始图像数据。

采集方式可以用手机或者iPad等进行拍摄,图像数据可以有平面图片和3D图片,但原理都一样的,如下图是平面与3D图像之间患者照片

产品经理入门:图像识别的标签训练产品经理入门:图像识别的标签训练

 

左边汽车代表了3D图像,支持三维空间中的体积和位置等特征,右边是仅用x,y坐标标注的平面图像。后者在标注处理上更容易,都会被遮挡所影响,但是平面图像在处理时候一定要给予方向,否则会影响应用。

 

市面上有非常多的数据标注开源软件,而建议大家选择比较稳定的labelimg,它是一款开源的基于python编写的标注工具,可以将标注文件导出为 PASCAL VOC 格式的 XML 文件或YOLO格式的TXT格式。在其默认版本中,labelimg 仅提供一种标注类型——边界框或矩形。但是,也可以使用 GitHub 页面使用代码添加另一个形状。

 

产品经理入门:图像识别的标签训练

 

在数据采集,产品经理要关注当前图像数据核心采集操作,是选择平面还是边框还是多边形。从而提升采集软件的采集效率。有时候还可以支持多人协同采集,增加了采集速度

 

产品经理入门:图像识别的标签训练

 

 

2.标签软件集成与打标签操作

 

有了采集软件,我们就要完成标签操作。大概步骤如下

 

  • 运行labelme后,打开文件夹

  • 使用多边形工具勾勒目标

  • 勾勒完成后创建标签

  • 微调边框,点击编辑多边形,有很多操作。

  • 最后存储

 

由此,产品策划上可以设计出至少2个端,分别是采集端和打标签端,前者负责采集数据,后者负责对数据进行标签特征提取。

 

产品经理入门:图像识别的标签训练

 

 

在采集软件中其中的标签

 

并将得到的图像进行处理,处理后得到2类文件:图像文件、以及图像标签文件。图像文件是JPG或者PNG,图像标签文件是JSON等数据格式。

 

产品经理入门:图像识别的标签训练

 

有了以上数据,我们才能开始进入深度模型训练训练,建设图像识别的可能。

 

图像数据处理后,通过这些图像导入在模型进行特征集合训练,就可以得到算法模型

 

3.半自动辅助与人工业务操作

 

训练获得的模型算法之后,就能够开始辅助医疗人工诊断,在诊断过程中以辅助形式帮助人工检查,人工对机器结果进行核对,从而不断调优算法模型。

 

产品经理入门:图像识别的标签训练

 

医学类的数据,一般会根据某个特例疾病的复杂度,来看需要多少样本。在这个阶段,这一点产品经理只是给出展示界面以及人工交互操作入口,同时基于以上管理端、采集端进行功能优化,提升采集效率。

 

在系统中记录数据日志,展示角色权限,可以让人对识别结果进行判断甚至是调整,不断优化模型识别结果。

 

4.全自动化操作

 

以上第三个步骤不断重复,最后实现在特例疾病下完全自动化操作,不需要人工操作就可以完成特殊疾病识别。

 

也是就是图像采集、标签、训练,产品经理的角色扮演。

 

 

“关注Kevin,看7W的产品经理生活&职场百态”

-------------------END-------------------

 

 

标签

微信扫一扫,分享到朋友圈

微信公众号

相关推荐