核心内容摘要
岁月如歌,尘埃落定——“艳照门”事件的深度回溯与人生启示
一ã€�什么是ç�«å±±å›¾â€”—转录组ä¸�蛋白组数æ�®åˆ†æ��çš„æ ‡é…�图表SCI领域的论文尤其是涉å�Šè½¬å½•组测åº�或蛋白质组å¦çš„ç ”ç©¶æ‚¨ä¸€å®šè§�è¿‡è¿™æ ·ä¸€å¼ å›¾æˆ�å�ƒä¸Šä¸‡ä¸ªæ•£ç‚¹åˆ†å¸ƒåœ¨ä¸€ä¸ªå¹³é�¢ä¸Šå®ƒä»¬åƒ�å–·å�‘çš„å²©æµ†ä¸€æ ·å�‘两侧上方扩散ä¸é—´é€šå¸¸æ˜¯ç�°è‰²çš„而两边顶部则点缀ç�€é²œè‰³çš„红色或è“�色。这就是ç�«å±±å›¾åœ¨å¦‚今的高通é‡�测åº�æ—¶ä»£å®ƒå‡ ä¹�æˆ�为了展示差异分æ��结æ�œçš„æ ‡é…�。è¦�ç�†è§£ç�«å±±å›¾æˆ‘们首先è¦�é�¢å¯¹ä¸€ä¸ªç�°å®�难题数æ�®æµ·ã€‚当我们对å®�验组例如患病组织和对照组例如å�¥åº·ç»„织进行测åº�时机器会å��出包å�«ä¸¤ä¸‡ç”šè‡³æ›´å¤šä¸ªåŸºå› çš„åº�大Excelè¡¨æ ¼ã€‚åœ¨è¿™ä¸ªè¡¨æ ¼ä¸æ¯�ä¸€ä¸ªåŸºå› éƒ½æœ‰è¡¨è¾¾é‡�的数值。é�¢å¯¹è¿™æˆ�å�ƒä¸Šä¸‡è¡Œæ�¯ç‡¥çš„æ•°æ�®æˆ‘ä»¬å¦‚ä½•ä¸€çœ¼å°±èƒ½çœ‹å‡ºå“ªäº›åŸºå› åœ¨ç”Ÿç—…å��å�˜å¤šäº†å“ªäº›å�˜å°‘了哪些å�˜åŒ–æ˜¯æœ‰ç»Ÿè®¡å¦æ„�义的 如æ�œä»…é� 肉眼å�»ç¿»çœ‹è¡¨æ ¼è¿™æ— 异äº�大海æ��针。图1 ç�«å±±å›¾çš„æ„�义ç�«å±±å›¾æ£æ˜¯ä¸ºäº†è§£å†³è¿™ä¸ªé—®é¢˜è€Œè¯�生的它将æ�¯ç‡¥çš„Excelè¡¨æ ¼æ•°æ�®è½¬æ�¢æˆ�了直观的视觉图åƒ�。图ä¸çš„æ¯�ä¸€ä¸ªç‚¹éƒ½ä»£è¡¨ä¸€ä¸ªåŸºå› ã€‚ç�«å±±å›¾å·§å¦™åœ°åˆ©ç”¨äºŒç»´å¹³é�¢å°†è¿™æˆ�å�ƒä¸Šä¸‡ä¸ªåŸºå› 按照两æ�¡æ ¸å¿ƒæ ‡å‡†è¿›è¡Œäº†æ�’åº�一æ�¡æ ‡å‡†çœ‹å�˜åŒ–大ä¸�大å�¦ä¸€æ�¡æ ‡å‡†çœ‹ç»“æ�œå‡†ä¸�准。ç�«å±±å›¾å�¯ä»¥å°†é‚£äº›å�˜åŒ–å¾®å°�ã€�或者虽然有å�˜åŒ–但统计å¦ä¸Šä¸�å�¯ä¿¡å�¯èƒ½æ˜¯å®�éªŒè¯¯å·®å¯¼è‡´çš„â€œæ— è�ŠåŸºå› â€�全部å�‹ç¼©åœ¨å›¾åƒ�的底部和ä¸å¿ƒä½�置通常用ç�°è‰²è¡¨ç¤ºæ„�味ç�€å®ƒä»¬æ˜¯â€œèƒŒæ™¯å™ªéŸ³â€�。而那些我们需è¦�çš„å·®å¼‚è¡¨è¾¾åŸºå› â€”â€”å�³é‚£äº›å�˜åŒ–幅度巨大且统计å¦ä¸Šé��å¸¸æ˜¾è‘—çš„åŸºå› åˆ™è¢«ç›é€‰å‡ºæ�¥é«˜é«˜åœ°æŠ›å�‘图åƒ�的左上角和å�³ä¸Šè§’。å�ªéœ€è¦�通过颜色的区分和点的ä½�置就能ä»�ä¸¤ä¸‡ä¸ªåŸºå› ä¸ç�¬é—´é”�å®šé‚£å‡ å��个最关键的部分。二ã€�为什么å�«ç�«å±±â€”—ç�†è§£Log2 Fold Changeä¸�-Log10 P-valueçš„å‡ ä½•æ„�义既然知é�“了ç�«å±±å›¾æ˜¯ç”¨æ�¥ç›é€‰åŸºå› 的那么一个问题éš�之而æ�¥ä¸ºä»€ä¹ˆå®ƒé•¿å¾—åƒ�一座ç�«å±±ä¸ºä»€ä¹ˆä¸�把它画æˆ�方形ã€�圆形或者æ�¡å½¢å›¾æ ¹æœ¬å�Ÿå› 在äº�æ�„æˆ�ç�«å±±å›¾çš„Xè½´å’ŒY轴这两个å��æ ‡è½´å¯¹å�Ÿå§‹æ•°æ�®è¿›è¡Œäº†ç‰¹æ®Šçš„å�˜å½¢æœ€ç»ˆå¡‘é€ å‡ºäº†ç�«å±±å–·å�‘的形æ€�。X轴在ç�«å±±å›¾ä¸å�«å�š Log2 Fold Changeå��å�Šéƒ¨åˆ†â€œFold Changeâ€�çš„å�«ä¹‰æ˜¯â€œå€�æ•°å�˜åŒ–â€�。比如生病组的æŸ�ä¸ªåŸºå› è¡¨è¾¾é‡�是å�¥åº·ç»„çš„4å€�那它的å€�æ•°å�˜åŒ–就是4。但是直æ�¥ç”¨å€�数画图有个大麻烦ä¸�对称。如æ�œåŸºå› A上调了4å€�数值是4åŸºå› B下调了4å€�数值是
25å�³1/4。在数轴上4离1æ— å�˜åŒ–很远但
25离1å�´å¾ˆè¿‘。这ç§�视觉上的ä¸�å¹³è¡¡ä¼šè®©æˆ‘ä»¬è¯¯ä»¥ä¸ºä¸Šè°ƒçš„åŸºå› æ¯”ä¸‹è°ƒçš„æ›´é‡�è¦�。为了解决这个问题“Log2â€�以2为底的对数这个数å¦å·¥å…·åº”è¿�而生。它的作用就åƒ�一é�¢å“ˆå“ˆé•œæŠŠæŒ¤åœ¨ä¸€èµ·çš„æ•°æ�®æ‹‰å¼€æŠŠä¸�对称的数æ�®å�˜å¯¹ç§°ã€‚ç»�过Log2处ç�†å��上调4å€�å�˜æˆ�了 2下调4å€�å�³1/4å�˜æˆ�了 -2没有å�˜åŒ–å�³1å€�å�˜æˆ�了 0。在这ç§�情况下横轴的ä¸å¿ƒæ˜¯0代表“没å�˜åŒ–â€�。 0çš„å�³è¾¹æ£æ•°ä»£è¡¨åŸºå› 上调0çš„å·¦è¾¹è´Ÿæ•°ä»£è¡¨åŸºå› ä¸‹è°ƒã€‚ç‚¹ç¦»ä¸å¿ƒ0越远说æ˜�è¿™ä¸ªåŸºå› å�˜åŒ–çš„å€�数越剧烈。Y轴在ç�«å±±å›¾ä¸çš„å¦å��å�«å�š -Log10 P-valueè¿™é‡Œçš„æ ¸å¿ƒæ˜¯ P-valueP值。在统计å¦é‡ŒP值代表“犯错的概ç�‡â€�或者“巧å�ˆçš„æ¦‚ç�‡â€�。P值越å°�例如
00001说æ˜�这个结æ�œæ˜¯å·§å�ˆçš„å�¯èƒ½æ€§å¾®ä¹�其微也就是结æ�œè¶Šé� è°±ã€�越显著。但在画图时如æ�œç›´æ�¥ç”¨På€¼æœ€å¥½çš„åŸºå› P值æ��å°�会趴在å��æ ‡è½´çš„æœ€åº•ä¸‹æ�¥è¿‘0è¿™ä¸�符å�ˆå¥½ä¸œè¥¿è¦�在上é�¢çš„æ£å¸¸ç›´è§‰ã€‚äº�是ç�«å±±å›¾ä¸å�¯ä»¥é‡‡ç”¨ä¸¤ä¸ªå°�技巧先å�–对数Log10å†�åŠ ä¸ªè´Ÿå�·-ã€‚è¿™æ ·ä¸€æ�¥å�Ÿæœ¬æ��å°�çš„P值比如
0001å°±å�˜æˆ�äº†å·¨å¤§çš„æ£æ•°æ¯”如4ã€‚çºµè½´çš„å‡ ä½•æ„�ä¹‰å› æ¤å�˜å¾—é��常直观高度代表“å�¯ä¿¡åº¦â€�。一个点在图ä¸çˆ¬å¾—越高说æ˜�它的P值越å°�统计å¦ä¸Šè¶Šæ˜¾è‘—我们对它“ä¸�是误判â€�的信心就越足。图2 ç�«å±±å›¾çš„Xè½´ä¸�Yè½´è§£æ��当我们将这两个å��æ ‡è½´ç»“å�ˆåœ¨ä¸€èµ·æ—¶ç�«å±±å›¾å°±è¯�生了。ç»�å¤§å¤šæ•°åŸºå› éƒ½æ˜¯å¹³åº¸çš„å®ƒä»¬æ—¢æ²¡æœ‰æ˜�显的å�˜åŒ–横轴é� è¿‘0ä¹Ÿæ²¡æœ‰æ˜¾è‘—çš„ç»Ÿè®¡å¦æ„�义纵轴é� è¿‘0å› æ¤å®ƒä»¬å¯†å¯†éº»éº»åœ°å †ç§¯åœ¨å›¾åƒ�的最底部ä¸å¿ƒæ�„æˆ�了ç�«å±±çš„åŸºåº§ã€‚è€Œæˆ‘ä»¬æ‰€å¯»æ‰¾çš„ç›®æ ‡â€”â€”æ—¢å�˜åŒ–剧烈横轴很宽å�ˆæ��度å�¯ä¿¡çºµè½´å¾ˆé«˜â€”—就会远离ä¸å¿ƒå�‘ç�€å·¦ä¸Šè§’å’Œå�³ä¸Šè§’é£�å�‡ã€‚è¿™ç§�ä¸é—´å¯†é›†ä½�å¹³ã€�两侧稀ç–�高耸的分布形æ€�åƒ�æ��了ç�«å±±å�£å–·å�‘出的岩浆å�‘两边é£�溅的ç�¬é—´è¿™å°±æ˜¯ç�«å±±å›¾å��称的由æ�¥ã€‚三ã€�划定界é™�——读懂图ä¸çš„å��å—准星ä¸�ç›é€‰æ ‡å‡†ç»�过梳ç�†æˆ‘们已ç»�æ˜�ç¡®ç�«å±±å›¾ä¸Šçš„æ¯�ä¸€ä¸ªç‚¹ä»£è¡¨ä¸€ä¸ªåŸºå› ä¹Ÿæ˜�白了它们为什么会呈ç�°å‡ºå–·å�‘的姿æ€�。但在阅读SCI论文时ç»�常会å�‘ç�°æ ‡å‡†çš„ç�«å±±å›¾ä¸Šé™¤äº†æ•£ç‚¹é€šå¸¸è¿˜ä¼šæœ‰å‡ æ�¡è™šçº¿ä¸€æ�¡æ¨ªç©¿è…°éƒ¨ä¸¤æ�¡ç«–切左å�³è¿™å‡ æ�¡çº¿æ�„æˆ�了图表上的å��å—准星。如æ�œè¯´å��æ ‡è½´æ�„建了地图那么这些虚线就是海关安检线å�Œæ ·å…·æœ‰é‡�è¦�æ„�义。首先是横å�‘的虚线它是统计å¦é—¨æ§›ã€‚å‰�é�¢æ��到过纵轴代表P值准确性。在生物统计ä¸é€šå¸¸å…¬è®¤ P-value
05 ä¸ºå…·æœ‰ç»Ÿè®¡å¦æ„�义。在负对数å‰�æ��下
05 ç»�过转æ�¢å��大约ç‰äº�
3ã€‚å› æ¤å¤§éƒ¨åˆ†å›¾çš„æ¨ªè™šçº¿éƒ½ä¼šç”»åœ¨çºµè½´
3 的高度。这æ�¡çº¿æ„�味ç�€çº¿ä»¥ä¸‹çš„åŸºå› æ— è®ºå�˜åŒ–å€�æ•°å¤šå¤§å› ä¸ºP值太大ä¸�å�¯ä¿¡ç»Ÿç»Ÿè¢«è§†ä¸ºâ€œå�‡é˜³æ€§â€�或“å�¶ç„¶äº‹ä»¶â€�而被淹没在ç�°è‰²çš„背景ä¸å�ªæœ‰çº¿ä»¥ä¸Šçš„åŸºå› æ‰�被认为是“真å®�å�‘生å�˜åŒ–â€�çš„å�¯ä»¥è¿›å…¥ä¸‹ä¸€è½®ç›é€‰ã€‚其次是纵å�‘的两æ�¡è™šçº¿å®ƒä»¬æ˜¯ç”Ÿç‰©å¦é—¨æ§›ã€‚è™½ç„¶æœ‰äº›åŸºå› åœ¨ç»Ÿè®¡ä¸Šæ˜¯æ˜¾è‘—çš„P值很å°�但如æ�œå®ƒçš„表达é‡�å�ªæ˜¯ä»� 100 å�˜æˆ�了 105è¿™ç§�微弱的å�˜åŒ–对细èƒ�的功能å�¯èƒ½æ ¹æœ¬æ²¡æœ‰å½±å“�ã€‚å› æ¤æˆ‘们需è¦�设定一个å�˜åŒ–的幅度通常是2å€�å�³ Fold Change 2 或
5。横轴的 Log2 转æ�¢ä¸‹2å€�对应的是å��æ ‡è½´ä¸Šçš„
1