These are chat archives for DataCanvasIO/APS-MODULEs

12th
Jun 2016
dkuner
@dkuner
Jun 12 2016 02:04
[+] 1 收集数据
[+] 2 格式化数据
[+] 3 分析数据
[+] 4 训练算法
[ ] 5 测试算法
[+] 6 使用算法
dkuner
@dkuner
Jun 12 2016 02:14
目前对格式化的实现是从源数据csv文件中根据参数定义的XY导出算法内部使用的XY对象,无论是绘图还是训练只要用到源数据统一使用这个对象而不从csv中解析了,存在的问题是如果workflow中有些module用python实现有些用R实现对接时需要先转成csv
dkuner
@dkuner
Jun 12 2016 03:44
测试算法使用交叉验证,可以考虑做两种:1)直接输出模型的评分(已完成) 这样可以快速评价模型 2)输出每一次验证的结果,后接可视化模块展示每次的残插值,此时验证次数固定5次。
dkuner
@dkuner
Jun 12 2016 04:47
测试算法使用交叉验证,可以考虑做两种:1)直接输出模型的评分(已完成) 这样可以快速评价模型 2)输出平均预测结果,后接可视化模块展示残插值。
dkuner
@dkuner
Jun 12 2016 08:07
[+] 1 收集数据
[+] 2 格式化数据
[+] 3 分析数据
[+] 4 训练算法
[+] 5 测试算法
[+] 6 使用算法
dkuner
@dkuner
Jun 12 2016 09:04
特征提取,选择,模型评估,这些每一类都可做多个module。