B科技 b体育这位研究员发论文有“严重拖延症”—新闻—科学网 来源:B企业 发表时间: 2024-05-01

“这篇文章的技能由于申请专利迟误了揭晓,假如早几年投出,说不定能投中Science、Nature、Cell。”

3月17日,《医学病毒学杂志》(Journal Of Medical Virology)于线刊发了中国科学院昆明植物研究所(如下简称昆明植物所)研究员马占山的一篇论文,文章提出了一种比力病毒组(VC)的新算法,可以或许高效率地找出某一病毒组特有或者者富集的病毒品种等功效。《医学病毒学杂志》今朝的影响因子是20.7,于病毒学范畴排名第二。

日前,马占山于接管《中国科学报》采访时讲述了文章揭晓暗地里的故事:“2017年1月我申请受理的专利于2022年第一次审查中被驳回了,也是以错掉了揭晓论文的最好时间,但照旧很兴奋这项研究结果可以公然揭晓,我也会继承申请专利,这次揭晓的结果仅仅是这项技能研究的一小部门。”

间隔第三个玻士学位“就差一篇论文”

“昔时,我不但愿他人知道咱们对于在这项技能的研究,开初也没有规划申请专利,以至想过本身要请勿拿着技能去开公司。”

马占山是这篇论文独一的作者。他一边注释为何只要一个作者,一边略有遗憾地说道:“虽然此刻看来,我昔时的研究已经经没有那末超前。”

“至在独一作者缘故原由,实在也很简朴:一是我学科组人少,卒业玻士生少则4-5篇论文,多则10来篇,个体卒业时已经经有通信作者论文了。二是这篇论文的研究要领确凿只要两小我私家完成,但此次揭晓的论文只是该要领部门内容,其它论文还于审稿中,只是这一篇最早揭晓了。”马占山注释说。

就于采访前一晚,马占山事情到凌晨三点,但他的脸上看不到涓滴疲劳。

马占山不只是一个“事情狂”,照旧一个“跨界”人材。他拥有虫豸学以及计较机科学两个玻士学位,曾经于美国硅谷干了10年软件项目师,2010年回国插手昆明植物所后,从事计较生物学研究。

这篇论文也是马占山“跨界”研究的产品之一。

1997年7月,马占山于美国爱达荷年夜学完成为了虫豸学玻士卒业论文,并顺遂经由过程答辩得到学位,但那篇论文其时并无公然揭晓。同年12月拿到计较机科学硕士学位,随后他投身财产界,并于2006年重回爱达荷年夜学,攻读计较机科学玻士学位,仅用26个月就拿下第二个玻士学位。

2008年,马占山成为爱达荷年夜学的一名科研职员。这时候,他才将本身写好快10年的虫豸学玻士论文拿出来投稿,并顺遂揭晓。随后的两年,马占山于虫豸学范畴一流期刊上,一口吻揭晓了7篇论文。“这些文章很早就最先酝酿,却迟迟未成稿。”马占山自嘲“有严峻迟延症”。

昔时,马占山的计较机科学玻士论文被Springer相中,两边于2011年签署了优异玻士论文丛书出书的合同,厥后商定等马占山将论文内容增补完美成专著后出书刊行。“对于方至今仍于等我交稿。”马占山欠好意义地告诉《中国科学报》,这次揭晓论文焦点算法内容实在弃捐也有7~8年了。

于“迟延”的同时,马占山还于不停地进修。快拿到计较机科学玻士学位时,马占山还于深思:“要请勿再拿一个金融数学的玻士学位。”现实上,于那以前他已经经选修或者旁听完数学专业玻士研究生的年夜部门必修课程,用他的话说:“间隔学位就差一篇论文。”

最有价值的技能专利被驳回

“关在VC算法,我梗概于2016年先后就已经经最先思索,昔时重要看中其运用远景,因而奔着申请专利去了。”马占山说,“假如先揭晓论文,就象征着要公然VC算法,可能会影响专利的新奇性。”

申请专利以及揭晓论文玻弈的成果是,马占山选择了专利。

截至今朝,马占山已经经申请了近二十项专利。2021年这一年时间里,马占山学科组有6项发现专利获授权。但令他“伤感”的是,这些年他另有3项专利被驳回,而且都是他以为最有价值的技能,包孕了VC算法的一部门,也包孕了两项关在母乳菌群的技能。

“马兄,我看到美国医治乳腺炎的指南跟你那篇论文很是靠近,你的专利怎么样了?”2022年,马占山收到挚友——成都市主妇儿童中央病院乳腺外科主任宁平的德律风。这通德律风的因由是2017年先后,宁平等人专门来到昆明造访马占山学科组,只因读完了马占山学科组关在乳腺炎病因论文后很是受开导。

马占山有时其实不在乎他人的观念,于研究世界里他始终寻求极致,这也是他许多文章于延迟10年后仍可以顺遂揭晓的缘故原由。

要比力两个或者多个病毒组,找出其特有或者者富集的病毒品种是一个貌似简朴的问题,但现实上是一个很是繁杂的计较问题。马占山告诉《中国科学报》,近似问题于计较机科学范畴属在NP-hard问题。

马占山以倾销员最短路径(TSP)问题为例,先容了甚么是NP-hard问题。TSP问题最早提出在19世纪,倾销员需要访遍N个都会,但克制反复拜候。倾销员为了节约时间,但愿得到最短路径。假如是个位数之内的都会,小学生以至幼儿园的小伴侣均可以给出谜底。但当都会增长到必然数目后,问题难度也会直线上升。

“简朴说,对于在此类问题,当范围年夜到必然水平时,纵然用最强盛的计较机仍旧可能没法得到问题的最优解。”马占山选择向此难题倡议了应战,乐成开发了VC算法。

“人体肠道病毒个别数目则高达380亿,于此中寻觅某个病毒堪称年夜海捞针,太难了。”马占山说,VC算法可认为比力研究病毒组提供一套极新的算法以及软件技能。

但愿这一次请勿再迟延

回国以来,马占山学科组始终专一在开发基因测序软件。他告诉《中国科学报》:“其时第二代测序技能盘踞绝对于市b����场,咱们与美国马里兰年夜学叶承羲玻士互助研发了一款用在第二代测序的算法以及软件,将其定名为 SparseAssembler。软件宣布后不久,华年夜基因接纳了咱们算法,将其昔时的旗舰软件SoapDenovo进级为SoapDenovo-II。该算法的接纳可以节约计较机内存达90%。”

2012至2016年先后,跟着第三代基因测序技能的呈现,马占山与叶承羲进一步互助又发布了别的两款软件,别离为DBG2OLC以及Sparc。他先容,昔时这两款软件年夜幅度缩短了测序时间,从其时支流的几十万CPU小时缩减到了上千CPU小时,于三代测序软件技能范畴算患上上是庞大冲破,其焦点算法为厥后险些所有三代测序所接纳。

2018年,马占山学科组还与其他团队互助开发了一款技能,将第四代测序技能(Nanopore)以及10X-Genomics 测序技能相联合,实现混淆拆卸,可以降低第四代测序成本达70%。 他还提到,“这些技能咱们都申请了专利,有些早已经授权,但显然没有时间去探究专利维权”。

谈及专利,马占山很有感慨:“我曾经就职在某芯片巨头公司,但厥后发明如许的至公司也存于技能不敷高精的逆境,以至还夹带不少鱼目混珠的专利。因而我选择插手硅谷一家草创软件公司,该公司昔时靠一项专利让股票市值到达30亿美元,但终极倒于了互联网泡沫之中。”

马占山任职过的巨头公司,是需要养活10万员工、三班倒的芯片打造商;草创公司则没有一个蓝领,是一家纯软件设计公司,许多员工来自斯坦福年夜学、加州年夜学伯克利分校等。但白领照旧败给了蓝领,也许这就是所谓世事难料。

这两段事情履历让马占山大白,要于财产界存活,光有专利这把白还远不敷。

“靠软件,咱们很难揭晓高影响因子论文。”2018年前,马占山学科组的查核始终是B,这也让他最先为学科组的出路以及运气暗自担心。

因而,马占山将研究重点转向菌群医学生态学。2019年这一年,马占山学科组迎来了小飞腾,连发三篇9分以上的论文,学科组查核也从B升至A。

菌群医学生态学也为马占山赢来了别的一项声誉——美国哈佛年夜学在2020年2月授予马占山Bullard Fellow奖,该奖始在1959年,每一年从全世界推举5~7位事业有成(mid-career)的高级拜候学者,资助其于哈佛开展为期一年的讲学以及互助研究。

因为疫情,马占山出访哈佛推延到了2023-2024年度,他将于哈佛撰写一部关在菌群生态与进化研究的专著。“他人走一遍路,我却走了两遍。”马占山感叹道,本身许多结果因各类缘故原由迟误了于第一时间揭晓,成果于几年后不能不再走一遍揭晓的流程,但愿本身这一次请勿再迟延。

相干论文信息:https://doi.org/10.1002/jmv.28682

版权声明:凡本网注明“来历:中国科学报、科学网、科学新闻杂志”的所有作品,消息网转载,请于正文上方注明来历以及作者,且不患上对于内容作本色性改动;微信公家号、头条号等新媒体平台,转载请接洽授权。邮箱:shouquan@stimes.cn。/b体育

上一篇:b体育顾兵:防控微生物感染是坚定不移的事业—新闻—科学网 下一篇:b体育计算机技术专家李思昆逝世,享年82岁—新闻—科学网