陈峰做的医学图像处理领域的数据集少得可怜,这个很容易理解,跟医药相关的数据大多都是各大医院的机密,论文作者不会轻易公开。</p>
也就是因为陈峰的导师跟花城市第一人民医院有项目合作,所以才能拿到部分相关数据。但拿到数据只是个开始,还需要陈峰自己进行数据处理。</p>
凌志就没这么幸运了,他的研究方向跟社交媒体中的舆情分析有关,具体而言就是找出社交网络中的水军,也就是属于同一个现实世界人类的不同账号。</p>
他们通过多个账号发布垃圾评论扰乱社交网络秩序为乐,甚至有的商业机构会专门雇佣水军发表负面言论攻击竞争对手,影响十分恶劣。</p>
水军自然不会告诉你自己是水军,而且社交网络的数据大多都很敏感,很少有人专门整理,所以这样的数据集很难弄到。</p>
凌志在过去一年的时间里在数据集上花费了大量的时间,目前他所用的比较好的办法是将同一个人发布的推文分成2份,假装是2个账号发布的,虽然不够真实,但从做实验的角度看足够了。</p>
凌志并不觉得有数据集和没有数据集这两种情况孰优孰劣,但凌志相信一句话,只要你付出,虽然不一定成功,但一定会有收获。</p>
所以尽管凌志在科研上进展缓慢,但采集社交网络数据的过程让他掌握了数据采集、数据分析以及数据预处理等多项技能。</p>
虽然他还算不上是处理数据领域的专家,但也算是积累了丰富的经验。</p>
“唉,话虽这么说,但是内心还是很痛苦的呀,老哥。我自己觉得效果差不多了,但是我导并不放过我啊。”</p>
“那算你倒霉,不过既然你导不满意,目前来看也只能在数据处理上再下下功夫了啊。”</p>
“只能这样了,我回去再挑一挑数据,看看有没有不干净的。”</p>
“那你努力,需要帮忙跟我说一声。”</p>
“行,没问题。那我先走了,拜拜。”</p>
“拜拜。”</p>
陈峰去了学院楼五楼,而凌志的实验室在二楼,所以陈峰坐电梯上去,而凌志直接开11路走楼梯上去了。</p>
时间还早,实验室只来了一个人,周敏师兄。</p>
周敏师兄比自己大1届,预计明年毕业。研究方向是导师王海波的老本行,多目标车辆路径优化问题。</p>
老王在这个领域深耕了多年,发表多篇论文。底下弟子也带过很多届了,一开始都是做这个方向。而从周敏师兄这一届开始,老王幡然醒悟,想要带领部分学生在其他研究领域开荒,所以就有了凌志现在的研究方向。</p>
凌志并没有觉得有什么不好,做老王的老本行也不见得万事轻松,你的每一个实验细节不到位都可能会遭受到王导的火眼金睛。开荒虽然也有开荒的难处,但是胜在能学到更多新知识,也有一定自由度。</p>
有自由度并不是说可以随意地编造实验结果,这属于学术造假,凌志是不会干这种事的。实际上说的是你数据采集的量,处理到的程度,代码的参数设置等。</p>
而当你用自己采集到的数据集以及自己编写的代码跑出一个不错的实验结果时,即便这个实验再简单,你也会有无与伦比的成就感。</p>
所以凌志对于自己的现状非常满足。</p>
“早啊,周敏师兄。”</p>
“早。”</p>
边说着,师兄打了一个大大的哈欠。凌志也没在意,坐到自己的座位上,打开电脑,准备将一篇跟词向量相关的文章打印出来仔细看看。</p>
实验室配备有一台专门的打印机,凌志拷好论文之后拿到打印机旁边那台电脑上插进去,可过了半天也没读出来盘。</p>
“不对啊,应该不是我U盘坏了啊。”</p>