如何做生物信息,学发 SCI 文章?

论文降重 独有nlp技术

免费使用,100%过查重,支持多种降重模式!

论文查重 检测与学校相同

一站式聚合平台,含知网、万方、维普等,正品且价优!

如何做生物信息,学发 SCI 文章?

问:如何做生物信息,学发 SCI 文章?

  • 答:就有人问,生信的文章能发到多少分?如果你是像华科薛宇教授一样的大牛,弄一套算法,编一个生信分析工具,十几分妥妥的,引用量杠杠的。但是,那是大牛,一般来说,按「常规套路」出牌的这种生信分析文章分值在 0-2 分之间。但也有些不做实验的生信分析文章能发到个 4-5 分,那么生信分析的文章怎么样能达到一个比较高的层次呢?
    这里,我们给大家分享两篇文章来说一说一些进阶的文章思路,一篇是发表在我们的老朋友「Oncotarget」上的,另一篇是发表在「Journal of Proteome Research」(IF = 4.1)上的。
    先看 Oncotarget 这篇「Genomic expression differences between cutaneous cells from red hair color individuals and black hair color individuals based on bioinformatic analysis」,文章是做的黑色素瘤的两种不同表型的个体的差异基因的生信分析。
    Abstract 里说到 MC1R 这个基因的突变会导致高患癌率的 RHC 表型两种不同的表型,其中 RHC 表型会增加皮肤癌的发生率,那么 MC1R 的突变究竟影响了哪些基因?文章通过 PPI 网络分析,分别对比分析两个不同表型(RHC 和 BHC)的正常皮肤细胞和癌细胞中的差异基因。结果表明,在癌细胞的对比中没有差异,而在正常皮肤细胞中筛选出 23 个 hub 基因,并且其中 8 个基因异常表达,这一结果提示这 8 个基因的异常表达可能是 RHC 表型患癌风险提高的重要原因。
    这篇文章利用了 3 个数据包进行综合分析,从而得到了一个 novel 的结论,文章利用 GSE44805 中的差异基因构建 PPI 网络筛选 hub 基因,再利用别的数据包中的测序结果验证这些基因确实存在异常表达,多方验证说明自己生信分析结果是可靠的。虽然作者一点实验也没有做,但是从数据量还有可靠性上来说,可能比自己辛辛苦苦地做小样本量测序还要靠谱。
    文章中的分析方法(差异基因以及 PPI 分析)都是我们非常熟悉的。筛选出差异基因,将上调和下调的基因分别构建 PPI 网络,得到文中的 4 张图(不管怎么说,这图的颜值比上一期套路中分析的文章要高得多)。
    这张图的构建方法这里不再赘述
    小结
    这篇文章的方法完全是可以借鉴和复制的,难点在于找到足够多的具有相似性和可比性的数据结果,以及找到一个合适的切入点得到一个相对 novel 的结论。
    下面看 Journal of Proteome Research 上的这篇文章「Weighted Protein Interaction Network Analysis of Frontotemporal Dementia」。
    一看这流程图就觉得这文章是生信专业的人做的文章。(本宫上学的时候,就觉得我们生命学院的学生都是码农,生物信息专业、生物医疗工程、生物科学这些专业的人天天都在编代码,完全感受不出生物专业的气息。)
    这文章讲得啥咧,就是先选出 13 个种子基因,然后根据 PPI 数据库中蛋白质互作关系构建这 13 个种子基因的第一层网络结构。
    再以第一层网络为种子构建第二层网络结构(然后电脑就死机了)。
    然后分析第二层网络的拓扑学结构,从中筛选出 hub 基因(图中绿点表示最初的 13 个种子基因,蓝点表示第一层的基因)。在构建过程中,随着基因数量的不断增加,最先选出的 13 个种子基因未必就是后来的 hub 基因。文中还设置了对照组,并详细讲述了这 13 个种子基因的筛选方法。因为整个分析过程都是建立在生信分析的基础上,属于完全架空的,所以整个研究过程十分讲究逻辑上的严谨性。
    小结
    之所向大家介绍这篇文章,是觉得这种思路在生信分析的文章中可以借鉴,种子基因的选择可以通过临床上疾病中基因突变的概率来进行筛选,然后构建两层 PPI 网络,进行 GO,KEGG 分析,从而预测新的未知的疾病相关基因,如果后续能从别的数据包中得到表达量的验证或者是自己在临床样本中进行验证,那么整个文章的内容将会更加丰富。
    局限性:PPI 数据库中其实很多蛋白质互作结果是没有意义的,因为在实际生物体中很多蛋白质互作情况是不可能发生的,只有在实验人为干预情况下才会发生。
  • 答:这个要自己想清楚了,本人是10年生物学研究生毕业,感觉工作不是很好找。如果是大学老师的话,一般需要时博士在读或者毕业,而且据我所知待遇也不怎么高,我的导师也就3000多吧,我们是211工程学校,可能学校不同情况也不一样。说实话考研不难考,只要你英语过线,考博比考研还简单,就是传说中的好进不好毕业,毕业需要发表论文,硕士一篇,博士三篇,好的学校对论文的质量还有具体要求。个人认为要是你刚开始当老师的话,还是踏实的干段时间,考研没有你想象的那么有用,特别是生物。当然,这个还是要你自己决定。

问:对于纯生信SCI来说,1分未必就好发,5分未必就难发?

  • 答:在正常的情况下,很多人普遍认为SCI期刊的影响因子越低,就越好投,就是容易发表。一般情况下,这样的思维和想法都是对的。但是对于一些特殊类的文章,这种想法是行不通的,例如纯生信(没有补任何实验的)。
    现在做纯生信的人非常多,竞争很大,特别是比较旧的分析套路,一般都是比较难发表。为什么比较旧的纯生信分析套路难发?原因就是在于成本低,可能随便在网上都能找到免费的资源, 所以基本上人人都可以做,文章特别容易弄出来。做的人多了,文章自然就多,但是期刊的版面是有限的,即使这本期刊再怎么水,也不可能把所有文章都接收出版。
    有的人是这样想的:虽然自己的文章没有什么创新,3分以上的期刊发不了,3分以下的期刊总可以投吧,不行的话,1分的期刊也可以考虑。最怕就是有无数的人都是这样想的,结果造成扎堆投稿,拒稿率自然就大。
    之前有朋友的纯生信文章总挑影响因子低的投稿,首先是投了 Med Sci Monit (IF:2.649,6月份之前是1点多的),结果被秒拒了,然后再投 Bioengineered (IF:3.269,6月份之前是2点多的),还是被秒拒。 后面有一次偶然的机会,被人鼓励投了一本接近5分的期刊,结果小修之后就被接收出版 。
    Med Sci Monit 、 Bioengineered 的影响因子不高,为啥这么难投? 原因很简单,人家对纯生信极度友好, 但是就是太出名了,造成扎堆投稿,期刊主编没有办法筛选稿件送审了,只能通过补实验来过滤。 有些高分一点的期刊反而还比较容易投,原因也很好理解, 人家愿意接收纯生信,而且投稿的人不多,命中的机会自然就多 。
    总结
    纯生信投稿的秘诀: 先搜索一下自己的文章,检查是否有类似文章发表,自己的文章是不是热点套路,是否抓住机会,再来决定期刊的影响因子。 出名的期刊尽量不投,不管其影响因子高不高 , 因为扎堆投稿的拒稿率从来都不低。

问:生信分析好发文章吗?

  • 答:只要找对问题和解决方法就不难:

    问题:

    第一,近几年有非常多的生信分析类文章,导致“通货”膨胀了。

    第二,做数据分析,需要明白相关性和因果性的区别。

    第三,大量生信分析类文章结论简单,可靠性很低。

    第四,很多作者不愿意或者没有条件对生信分析结论进行验证。

    解决方法:

    首先,对于生信的分析不要流于表面,要找到重要的问题.

    其次,提高编程和生信分析的技能,从多角度多数据作出更全面的分析。

    第三,尽可能地对结果或者预测进行实验验证,或者与有条件的实验室进行合作。

    第四,除了采用公共数据集,对于在医院的小伙伴,可以产生自己的一些数据。

问:生信分析和后续实验验证要一个物种吗?

  • 答:生信分析是一种利用生物信息学方法研究生命科学问题的研究方法,它可以用来对生物大分子(如基因、蛋白质等)进行高通量测序、转录组分析、蛋白质组分析等。
    在进行生信分析时,一般需要选择一个物种作为研究对象,并从这个物种中收集样本进行分析。这样做的原因是,不同物种之间的基因组、转录组、蛋白质组等信息可能
  • 答:不仅生物信息学分析结果要验证,任何的分析结果都需要验证,科学是非常严谨的,既然你做出了分析结果,但谁也不知道你的结果的正确率是多少,不能给人直观的表现,需要真实的数据来表示才行,不然,你的结果如何给别人说明就是对的呢。若是进行验证,你的结果正确率比别的软件分析的结果正确率更好更高,那么你就可以写论文了。因此生物信息学的分析结果要求具有实验验证以及别人的分析同一事物的结果作为对比。
  • 答:2021年10月9日更进一步,如你最后筛选的单基因,可增加对它进行敲低/过表达,开展功能实验,与生信分析的功能富集进行结果验证。 以上验证思路,其中第3点的验证...

问:生信分析和meta分析有什么不同?

  • 答:生信分析和meta分析是两种不同的数据分析方法。生信分析是一种从生物信息学数据中提取知识的方法,而meta分析是一种对已有研究进行综合性评估的方法。

    生信分析主要关注的是从大量复杂的数据中寻找规律和关联,而meta分析则集中在对已有研究进行归纳和总结,以便得出有关特定问题的客观、权威性结论。

    相比之下,生信分析要求分析师具备相当丰富的生物学背景知识,而meta 分析对于背景知识要求并不高。此外,由于meta 分享依赖于已有的研究成果,因此它受到文章质量、发表时间以及作者影响较小。相反,生信则存在较大的风险,因为它依赖于底层数据的准确性和可靠性。

    生信分析是对生物信息学数据进行统计建模和分析的过程。而meta分析是对已经发表的研究或实验进行系统性、综合性的统计和分析。