98年8月(第206期)
基因是如何命名的-以水稻基因符號為例說明
農試所作物組 魏夢麗‧呂椿棠‧呂秀英
一. 前言
基因是生物遺傳的單位, 當不同的學者研究相同的基因時,若是不同學者給予這個基因不同的名稱,就會造成一個基因有好幾個名稱及符號,進而引起混淆。因此,各研究機構 都趨向以共同的、普遍的、科學的制度來命名基因符號,以利於基因之結構、功能及演化研究上的學術交流,同時 讓基因組資料庫中基因相關資訊的搜尋變得更有效率。水稻是世界主要糧食作物之一,水稻基因組研究一直以來受到全球之重視,也是最早完成定序的作物,因此藉由知道水稻基因符號的命名原則,將有助於瞭解一般基因是如何命名的。
二. 水稻基因命名原則的歷程
基因命名以使用共通的國際語言(英文)為最佳,同時基因的名稱要能說明表型 (phenotype) 或傳達基因的功能或特性。 1957 年首先由國際遺傳符號及命名委員會 (International Committee on Genetic Symbols and Nomenclature, ICGSN ) 正式發表細菌、植物、老鼠及人類的遺傳符號的命名準則,之後許多物種的命名規則也都已被模式化。但是隨後人類、老鼠及其他物種的研究團體及人員分別在各專屬網站或出版的科學期刊上,又紛紛提出修正版本,分別建立個別物種的基因符號之命名標準原則,但是基本上仍是以 ICGSN 所提出的準則為主體架構。水稻基因的命名是於 1963 年根據 ICGSN 會議通過,而後經聯合國農糧組織 ( Food and Agriculture Organization of the United Nations, FAO) 的國際稻米委員會 ( International Rice Commission, IRC) 加以補充,才有了明確規範。歷經 20 多年後,由於水稻遺傳研究之快速發展,使得水稻基因的符號與命名規則有重新審視和修改之需要,因此再於 1986 年由 水稻基因符號、命名及連鎖基因委員會 ( Committee on Gene Symbolization, Nomenclature and Linkage, CGSNL ; http://www.shigen.nig.ac.jp/rice/oryzabase_submission/gene_nomenclature) 再行修正,主要以描述基因相關表型作為水稻基因命名及基因符號的規則,在 2004 年 12 月水稻基因組定序草圖完成之前,一直被 水稻研究人員廣泛採用。 由於基因的分子生化特性日益受到重視, 隨著 更多新的檢測方法,針對基因的定性描述也越來越多,因此 2004 年國際水稻基因組定序團隊 (International Rice Genome Sequencing Project, IRGSP) 在日本筑波所舉行 RAP-1 會議中建議增修水稻命名規則,希望它能反映出特定遺傳背景之等位基因及基因生化特性。於是 CGSNL 又在 2005 年 完成水稻基因命名規則的修改,更新文件中除了原有外表型變異的描述外,也參考 其他模式生物命名規則的作法, 增加了 DNA 、 RNA 及蛋白質序列等訊息來描述基因的標準規則。
三. 水稻基因命名與基因符號的一般原則
現行水稻基因及基因符號命名的一般原則整理如下:
( 一 ) 基因全名:命名的基因必須是經過合理證明獲得已存在之基因, 所有新發現的基因應先至 CGSNL 註冊,以避免發生重複和名稱混淆之問題。基因的全 名由名字 (name) 和 1~3 個數字基因座位點指示符號 (locus designator) 組成 ;其中名字要 能說明表型或傳達基因功能或特性 ,至於基因座位點若最初發現基因時還未知則將符號 設為 1 ,往後 陸續發現與該基因具相似特性的新基因,再由 CGSNL 按順序付與該基因一個新的 座位點指示符號。基因的名字以大寫斜體英文表示,與座位點指示符號書寫同一行並中間留一空格,例如 脫粒性基因 SHATTERING 1 。
( 二 ) 基因符號:是基因全名的縮寫,其由基因分類符號 (gene class symbol) 與基因座位點指示符號 (locus designator) 兩部分組成。基因分類符號以 2~3 個字母縮寫而成,並儘可能表達其功能與特點,且一律以大寫斜體字母表示;基因座位點指示符號由 1-3 個數字組成,與基因分類符號之間不需有空格。例如 脫粒性基因 SHATTERING 1 ,其符號為SH1 。 但對於命名原則尚未確定前的舊有基因符號 ,即使不符合現有規則仍予以保留,例如糯稻胚乳基因GLUTINOUS ENDOSPERM 早期符號為WX ,現仍保留並書寫成WX1 。
( 三 ) 等位基因 : 等位基因的全名和符號都以小寫斜體字表示,並分別用大、小寫字首來區分顯性及隱性基因。例 如水稻抗白葉枯病之顯性基因Xanthomonas campestris pv. oryzae resistance 13 的符號為 Xa13 ,而隱性基因xanthomonas campestris pv.oryzae resistance 13 的符號為xa13 。
( 四 ) 非等位基因但基因表型相似 ( 包括重複基因及互補基因 ) ,則在基因符號後加一短橫線再標以不同的字母或數字。例如水稻雜種弱勢基因 HYBRID WEAKNESS(LEATHAL)-C1 及 HYBRID WEAKNESS(LEATHAL)-C2 是兩個互補基因,符號分別為HWC-1 , HWC- 2 。
( 五 ) 數量性狀基因座 (quantitative trait loci, QTL) 的基因,在基因符號的最前面加小寫 q 。例如水稻營養生長期基因BASIC VEGETATIVE PHASE (QTL)-4 是數量性狀基因,其符號為qBVP-4 。
( 六 ) 當一個新發現的基因若與先前已發表基因的等位關係尚未確定前,則在基因符號後加上 * 或 (t ) ,表示暫定。例如 水稻抗白葉枯病顯性基因的符號Xa25 (t) ,一旦該基因的等位關係確定後,才會將 * 或 (t) 移除。
四. 結語
隨著科技進步,各物種的研究團體在其專屬網站及期刊上,對於基因符號及命名的原則仍不時提出修正。但這也造成在各不同期刊上新舊名稱或符號混合使用,因此常會造成讀者混淆不清而感到困惑。生物科學領域研究中使用基因符號的頻率很高,為有利研究的進展及學術交流,研究人員應該採以共同的科學制度來命名基因,這也是目前各研究團體的共識及仍繼續積極努力達成的目標。最後在此提供生物基因命名的幾個重要網址 : 水稻基因符號及命名法則的最新資訊,可到日本水稻資料庫 Oryzabase (http://www.shigen.nig.ac.jp/rice/oryzabase_submission/gene_nomenclature/) ,至於 其他物種基因命名及基因符號的相關網址,如人類基因體組織 (Human Genome Organisation, HUGO ; http://www.genenames.org/ guidelines.html ) 、 老鼠基因組資訊網 (Mouse Genome Informatics, MGI ; http://www.informatics.jax.org/mgihome/nomen/) 、玉米遺傳及基因組資料庫 ( Maize Genetics and Genomics Database, MaizeGDB ;
http://www.maizegdb.org/maize_nomenclature.php) 、 阿拉伯芥資訊網 ( Arabidopsis Information Resource, TAIR ; http://www.arabidopsis.org/info/guidelines.jsp) 等。