“老师,你在工作吗?”
刚学习了一个小时,正在休息的颖儿看着自己的老师对着一台笔记本电脑。
屏幕上是密密麻麻的数据表格,数字、参数、坐标值像瀑布一样从上到下排列着。
“不算是工作。”齐点摇了摇头,“这是一个项目的实验数据。他们的实验遇到了瓶颈,需要一个理论或者模型去支撑。”
“所以那个前辈把数据共享到了内网,看我们能不能提供些帮助。”
“是机密吗?”颖儿问。
“算是,但等级不高,基本上研究部都有资格查阅。”
“那我可以看吗?”
“当然可以。你可以用自己的内网账号去研究部分区,找到启示计划,里面置顶的链接就是共享的数据。”
颖儿两年前就获得了研究部正式成员的身份,自然也获得了内网账号。
但颖儿基本上没怎么上过内网,也很少询问联盟的事务。
她的世界里只有学习,只有那些优美的数学定理和公式。对于联盟内部的各种项目和事务保持距离。
“不用了,我看老师的就好了。”
颖儿拉过一把椅子,在齐点旁边坐下。
“那行。”
齐点只当颖儿是好奇,把电脑屏幕侧了一下,让她能看清楚。
自己则又趁着这段闲暇时间开始处理那些数据,寻找可能存在的规律。
三年过去,颖儿的基础知识都已经学的差不多了。
从最初的启蒙教学到后来的实分析、复分析、抽象代数、拓扑学、泛函分析……
那些让数学专业学生都头疼的课程,颖儿都已经系统地学习完毕。
齐点甚至感觉自己已经没什么能教她的了,也不太敢继续深入教下去。
毕竟他不是数学专业出身,再往前走就是数论、代数几何、微分流形这些纯数学的深水区,那已经超出了他的能力范围。
现在主要是颖儿自己在看一些进阶的数学课程。齐点也在给她寻找新的数学老师。
看了一眼好奇的颖儿,齐点放慢了自己处理数据的速度。
启示计划他们提供的数据量相当庞大。
成百上千个实验体,每个实验体都有多组位点坐标、电流参数、刺激频率、脉宽设置、响应时间、清醒持续时长……数据维度高达二十多个。
数据量大不是最关键的,最关键的是这些数据根本就没有经过处理,有些甚至是明显的异常值。
这是典型的混乱数据集。
但齐点的基础扎实得令人钦佩。
他首先进行了数据清洗。
识别并标记异常值,补全缺失数据,统一单位和格式。
这一过程可不简单,因为那些数据不是纯粹的数据,它们背后代表的是一次实验。
还好齐点对神经生物学和电生理学都有点涉及,他凭借自己那广泛的知识面对这些数据进行常规的处理。
原本混乱的数据,逐渐呈现出某种结构化的模样。
“数据本身的质量还不错。”
齐点一边操作一边自言自语。
“虽然记录有些混乱,但实验控制很严格,重复性实验做得很充分……不愧是启示计划。”
颖儿安静地坐在旁边,目光在屏幕上的数据和图表之间游移。
她看不太懂那些神经科学的术语,但数字本身就具有美感。
齐点完成基础整理后,开始尝试寻找规律。
他先用了最直接的方式,相关性分析,试图找出哪些参数与清醒时长存在强相关。
结果让人失望。除了刺激位点数量与清醒时长的正相关,其他参数的相关性都很弱,而且分散。
他换了一个思路,尝试聚类分析。
依然没有清晰的结果。
齐点皱起眉头,手指在键盘上敲打的速度慢了下来。
他又尝试了决策树、随机森林、支持向量机……各种机器学习算法轮番上阵。
这些算法能够拟合数据,能够对新样本做出预测,但准确率都不高,而且无法给出可解释的规律。
“个体差异的根源在哪里……”
齐点喃喃自语,目光在屏幕上的数据集中搜寻。
“是神经网络的拓扑结构差异?是突触密度的差异?还是某种更深层的代谢参数差异?”
他切换到另一个视角,开始分析位点之间的空间关系。
依然没有明显的规律。
时间一分一秒过去。
齐点的思路在不断变化。
从线性模型到非线性模型,从统计方法到机器学习,从单一变量分析到多变量分析,从静态关系到动态关系……
他的知识面确实足够广,几乎尝试了所有主流的数据分析方法,甚至还自己临时改进了几个算法以方便自己使用。
但数据就像一个顽固的谜题,始终不肯展露真相。
就在齐点准备尝试下一种方法时,颖儿突然开口了。
“老师。”她的声音有些犹豫,“这几组数据……好像有种说不上来的感觉。”
齐点的手指停在键盘上,转头看向她。
“哪几组?”
颖儿指着屏幕上的一个数据表格。
“这里,07号实验体、23号实验体、41号实验体……还有56号。”
齐点仔细看了看这几行数据。
从数值上看,它们似乎没什么特别的,电流参数、位点坐标、响应时间都在正常范围内,分散在整个数据集的不同区域。
“什么感觉?”
颖儿沉默了几秒,似乎在组织语言。
她在数学的世界里浸淫了三年,习惯了严格的定义和证明,但现在她需要描述的是一种模糊的直觉。
“它们……它们之间的关系不太一样。”
颖儿缓缓说道:"我看老师你的分析,一直在找变量和结果之间的关系,或者是各种变量间的组合效应。”
“但这几组数据,它们的特殊性不在于某几个数字大或小,而在于……"
她停顿了一下,努力寻找合适的词汇。
“它们内部的比例关系。”
颖儿终于找到了表达方式。
“就像……就像一个几何图形,你可以把它放大缩小,整体平移,但它的形状不变。”
“这几组数据,如果把它们看成高维空间里的点,它们到某个中心的距离的相对比例是相似的。”
这么讲还是很抽象,颖儿觉得没有把这些数据的关系阐述明白。
但齐点已经陷入了沉思,他重新看着那几组数据,好像有点明白颖儿的意思。
“你等一下。我把这几组数据单独提取出来……”
齐点又开始敲击键盘,但这一次和以往都不一样。
他的眼睛越来越亮,就像学生在考场上做压轴大题有了思路一样。
当结果出来那一刻,齐点感觉比吃了人参果还要爽,浑身上下每一个毛孔都在呼吸。
“这些数据确实存在一致性。”
他转头看向颖儿。
“你是怎么发现的?”
颖儿思考了一会儿,摇了摇头。
“我也说不清楚。就好像……这些数据会说话,是它们告诉我的。”