提交到序列操作套件的序列不會(huì)離開(kāi)您的計(jì)算機(jī),而是由執(zhí)行 JavaScript 的 Web 瀏覽器進(jìn)行操作。 序列操作套件由 Paul Stothard(加拿大阿爾伯塔大學(xué))編寫。 將問(wèn)題和意見(jiàn)發(fā)送至stothard@ualberta.ca。
以下是組成序列操作套件的程序的簡(jiǎn)短描述:
格式轉(zhuǎn)換:
結(jié)合 FASTA - 將多個(gè) FASTA 序列記錄轉(zhuǎn)換為單個(gè)序列。 例如,當(dāng)您希望使用接受單個(gè)序列作為輸入的程序來(lái)確定序列集合的密碼子使用情況時(shí),請(qǐng)使用組合 FASTA。
EMBL 到 FASTA - 接受一個(gè)或多個(gè) EMBL 文件作為輸入,并以 FASTA 格式返回每個(gè)文件的 DNA 序列。 當(dāng)您希望從 EMBL 文件中快速刪除所有非 DNA 序列信息時(shí),請(qǐng)使用此程序。
EMBL 特征提取器 - 接受一個(gè)或多個(gè) EMBL 文件作為輸入,并讀取特征表中描述的序列特征信息。 程序提取或突出顯示相關(guān)的序列段,并以 FASTA 格式返回每個(gè)序列特征。 當(dāng)您希望從包含許多內(nèi)含子的基因組序列中提取 cDNA 序列時(shí),EMBL 特征提取器特別有用。
EMBL反式提取器 - 接受一個(gè)或多個(gè) EMBL 文件作為輸入,并以 FASTA 格式返回文件中描述的每個(gè)蛋白質(zhì)翻譯。 當(dāng)您對(duì) DNA 序列的預(yù)測(cè)蛋白質(zhì)翻譯比 DNA 序列本身更感興趣時(shí),可以使用 EMBL Trans Extractor。
DNA過(guò)濾器 - 從文本中刪除非 DNA 字符。 當(dāng)您希望從序列中刪除數(shù)字和空格以使其適用于其他應(yīng)用程序時(shí),請(qǐng)使用此程序。
過(guò)濾蛋白質(zhì) - 從文本中刪除非蛋白質(zhì)字符。 當(dāng)您希望從序列中刪除數(shù)字和空格以使其適用于其他應(yīng)用程序時(shí),請(qǐng)使用此程序。
GenBank 到 FASTA - 接受一個(gè)或多個(gè) GenBank 文件作為輸入,并以 FASTA 格式返回每個(gè)文件的完整 DNA 序列。 當(dāng)您希望從 GenBank 文件中快速刪除所有非 DNA 序列信息時(shí),請(qǐng)使用此程序。
GenBank 特征提取器 - 根據(jù) GenBank 發(fā)行說(shuō)明中概述的規(guī)則,接受一個(gè)或多個(gè) GenBank 文件作為輸入,并讀取特征表中描述的序列特征信息。 程序提取或突出顯示相關(guān)的序列段,并以 FASTA 格式返回每個(gè)序列特征。 當(dāng)您希望從包含許多內(nèi)含子的基因組序列中提取 cDNA 序列時(shí),GenBank 特征提取器特別有用。
GenBank 反式提取器 - 接受一個(gè)或多個(gè) GenBank 文件作為輸入,并以 FASTA 格式返回文件中描述的每個(gè)蛋白質(zhì)翻譯。 當(dāng)您對(duì) DNA 序列的預(yù)測(cè)蛋白質(zhì)翻譯比 DNA 序列本身更感興趣時(shí),應(yīng)該使用 GenBank Trans Extractor。
一到三 - 將單字母翻譯轉(zhuǎn)換為三字母翻譯。
范圍提取器 DNA - 接受一個(gè)或多個(gè) DNA 序列以及一組位置或范圍。 與位置或范圍相對(duì)應(yīng)的堿基以單個(gè)新序列、一組 FASTA 記錄、大寫文本或小寫文本的形式返回。 使用 Range Extractor DNA 獲取使用位置信息的子序列。
范圍提取器蛋白質(zhì) - 接受一個(gè)或多個(gè)蛋白質(zhì)序列以及一組位置或范圍。 與位置或范圍相對(duì)應(yīng)的殘基以單個(gè)新序列、一組 FASTA 記錄、大寫文本或小寫文本的形式返回。 使用 Range Extractor Protein 獲取使用位置信息的子序列。
反向補(bǔ)碼 - 將 DNA 序列轉(zhuǎn)化為其反向、互補(bǔ)或反向互補(bǔ)序列。 支持整個(gè) IUPAC DNA 字母表,并保持每個(gè)輸入序列字符的大小寫。 如果序列在反向鏈上包含 ORF,您可能希望使用該序列的反向補(bǔ)碼。
分裂密碼子 - 將編碼序列分成三個(gè)新序列,每個(gè)序列由三個(gè)密碼子位置之一的堿基組成。
拆分 FASTA - 將 FASTA 序列記錄劃分為您指定大小的更小的 FASTA 序列。 可選的重疊值可用于創(chuàng)建重疊的序列。
三到一 - 將三個(gè)字母的翻譯轉(zhuǎn)換為單字母的翻譯。 數(shù)字和空格會(huì)自動(dòng)刪除。 非標(biāo)準(zhǔn)三元組被忽略。
窗戶提取器 DNA - 接受一個(gè)或多個(gè) DNA 序列以及位置和窗口大小。 位于窗口中的堿基以新序列、大寫文本或小寫文本的形式返回。 使用 Window Extractor DNA 獲取使用位置信息的子序列。
窗口提取器蛋白 - 接受一個(gè)或多個(gè)蛋白質(zhì)序列以及位置和窗口大小。 位于窗口中的殘基以新序列、大寫文本或小寫文本的形式返回。 使用 Window Extractor Protein 獲取使用位置信息的子序列。
序列分析:
密碼子圖 - 接受 DNA 序列并生成由每個(gè)密碼子的水平條組成的圖形圖。 條的長(zhǎng)度與您輸入的密碼子頻率表中的密碼子頻率成正比。 使用密碼子圖查找可能表達(dá)不佳的 DNA 序列部分,或查看密碼子使用表的圖形表示(通過(guò)使用由每種密碼子類型之一組成的 DNA 序列)。
密碼子使用 - 接受一個(gè)或多個(gè) DNA 序列并返回每種密碼子類型的數(shù)量和頻率。 由于該程序還比較了編碼相同氨基酸(同義密碼子)的密碼子的頻率,因此您可以使用它來(lái)評(píng)估序列是否顯示出對(duì)特定同義密碼子的偏好。
CpG 群島 - 使用 Gardiner-Garden 和 Frommer (1987) 描述的方法報(bào)告了潛在的 CpG 島區(qū)域。 使用以 1 bp 間隔在序列中移動(dòng)的 200 bp 窗口進(jìn)行計(jì)算。 CpG 島定義為 Obs/Exp 值大于 0.6 且 GC 含量大于 50% 的序列范圍。 窗口中 CpG 二聚體的預(yù)期數(shù)量計(jì)算為窗口中“C”的數(shù)量乘以窗口中“G”的數(shù)量,除以窗口長(zhǎng)度。 CpG 島經(jīng)常出現(xiàn)在脊椎動(dòng)物基因的 5' 區(qū)域,因此該程序可用于突出顯示基因組序列中的潛在基因。
DNA 分子量 - 接受一個(gè)或多個(gè) DNA 序列并計(jì)算分子量。 序列可以被視為雙鏈或單鏈,以及線性或環(huán)狀。 計(jì)算分子拷貝數(shù)時(shí)使用 DNA 分子量。
DNA 模式查找 - 接受一個(gè)或多個(gè)序列以及搜索模式,并返回與該模式匹配的站點(diǎn)的數(shù)量和位置。 搜索模式被編寫為 JavaScript 正則表達(dá)式,類似于用其他編程語(yǔ)言(如 Perl)編寫的正則表達(dá)式。
DNA統(tǒng)計(jì) - 返回您輸入的序列中每個(gè)殘基的出現(xiàn)次數(shù)。 還給出了每個(gè)殘基和某些殘基組的百分比總數(shù),使您可以快速比較不同序列獲得的結(jié)果。
模糊搜索 DNA - 接受一個(gè) DNA 序列和一個(gè)查詢序列,并返回與查詢相同或相似的位點(diǎn)。 例如,您可以使用該程序來(lái)查找可以輕松突變?yōu)橛杏玫南拗菩晕稽c(diǎn)的序列。
模糊搜索蛋白 - 接受一個(gè)蛋白質(zhì)序列和一個(gè)查詢序列,并返回與查詢相同或相似的位點(diǎn)。
Ident 和 Sim - 接受一組對(duì)齊的序列(FASTA 或 GDE 格式)并計(jì)算每個(gè)序列對(duì)的同一性和相似性。 同一性和相似性值通常用于評(píng)估兩個(gè)序列是否具有共同的祖先或功能。
變異摘要 - 接受 DNA 序列作為輸入,并搜索易于突變的區(qū)域以創(chuàng)建感興趣的限制性位點(diǎn)。 該程序還報(bào)告蛋白質(zhì)翻譯,以便您可以查看哪些閱讀框被建議的突變改變。 使用 Mutate for Digest 查找可以使用 PCR 或定點(diǎn)誘變轉(zhuǎn)化為有用的限制性位點(diǎn)的序列。
多轉(zhuǎn)反 - 接受蛋白質(zhì)比對(duì)并使用密碼子使用表生成簡(jiǎn)并 DNA 編碼序列。 該程序還返回一個(gè)圖表,該圖表可用于在核苷酸水平上找到最小簡(jiǎn)并區(qū)域。 在設(shè)計(jì) PCR 引物以與相關(guān)物種的未測(cè)序編碼序列退火時(shí)使用 Multi Rev Trans。
開(kāi)放閱讀框查找器 - 在您輸入的 DNA 序列中搜索開(kāi)放閱讀框 (ORF)。 該程序返回每個(gè) ORF 的范圍,以及它的蛋白質(zhì)翻譯。 ORF Finder 支持整個(gè) IUPAC 字母表和幾個(gè)遺傳密碼。 使用 ORF Finder 搜索新測(cè)序的 DNA 以尋找潛在的蛋白質(zhì)編碼片段。
成對(duì)對(duì)齊密碼子 - 接受兩個(gè)編碼序列并確定最佳全局比對(duì)。 使用 Pairwise Align Codons 尋找保守的編碼序列區(qū)域。
成對(duì)比對(duì) DNA - 接受兩個(gè) DNA 序列并確定最佳全局比對(duì)。 使用 Pairwise Align DNA 尋找保守的序列區(qū)域。
成對(duì)比對(duì)蛋白 - 接受兩個(gè)蛋白質(zhì)序列并確定最佳全局比對(duì)。 使用 Pairwise Align Protein 尋找保守的序列區(qū)域。
PCR第一統(tǒng)計(jì) - 接受 PCR 引物序列列表并返回描述每個(gè)引物特性的報(bào)告,包括熔解溫度、GC 含量百分比和 PCR 適用性。 使用 PCR Primer Stats 評(píng)估潛在的 PCR 引物。
PCR產(chǎn)物 - 接受一個(gè)或多個(gè) DNA 序列模板和兩個(gè)引物序列。 該程序搜索可以產(chǎn)生 PCR 產(chǎn)物的完全匹配的引物退火位點(diǎn)。 任何產(chǎn)生的產(chǎn)物都按大小排序,并給它們一個(gè)標(biāo)題,說(shuō)明它們的長(zhǎng)度、它們?cè)谠夹蛄兄械奈恢靡约爱a(chǎn)生它們的引物。 您可以使用線性或環(huán)狀分子作為模板。 使用 PCR 產(chǎn)品確定您在實(shí)驗(yàn)室中進(jìn)行 PCR 時(shí)可以看到的產(chǎn)品大小。
蛋白質(zhì)肉汁 - Protein GRAVY 返回您輸入的蛋白質(zhì)序列的 GRAVY(親水性的大平均值)值。 通過(guò)將每個(gè)殘基的親水性值相加并除以序列長(zhǎng)度來(lái)計(jì)算 GRAVY 值(Kyte 和 Doolittle; 1982)。
蛋白質(zhì)等電點(diǎn) - 計(jì)算您輸入的蛋白質(zhì)序列的理論 pI(等電點(diǎn))。 當(dāng)您想知道在 2-D 凝膠上大約可以找到特定蛋白質(zhì)的位置時(shí),請(qǐng)使用蛋白質(zhì)等電點(diǎn)。
蛋白質(zhì)分子量 - 接受一個(gè)或多個(gè)蛋白質(zhì)序列并計(jì)算分子量。 您可以使用提供的列表附加常用表位和融合蛋白的副本。 如果您希望預(yù)測(cè)目標(biāo)蛋白質(zhì)在凝膠上相對(duì)于一組蛋白質(zhì)標(biāo)準(zhǔn)品的位置,請(qǐng)使用蛋白質(zhì)分子量。
蛋白質(zhì)模式查找 - 接受一個(gè)或多個(gè)序列以及搜索模式,并返回與該模式匹配的站點(diǎn)的數(shù)量和位置。 搜索模式被編寫為 JavaScript 正則表達(dá)式,類似于用其他編程語(yǔ)言(如 Perl)編寫的正則表達(dá)式。
蛋白質(zhì)統(tǒng)計(jì) - 返回您輸入的序列中每個(gè)殘基的出現(xiàn)次數(shù)。 還給出了每個(gè)殘基和某些殘基組的百分比總數(shù),使您可以快速比較不同序列獲得的結(jié)果。
限制文摘 - 用一種、兩種或三種限制酶切割虛擬限制性消化中的 DNA 序列。 生成的片段按大小排序,并給它們一個(gè)標(biāo)題,說(shuō)明它們的長(zhǎng)度、它們?cè)谠夹蛄兄械奈恢靡约爱a(chǎn)生它們的酶位點(diǎn)。 您可以消化線性或環(huán)狀分子,甚至是分子混合物(通過(guò)以 FASTA 格式輸入多個(gè)序列)。 使用 Restriction Digest 確定您在實(shí)驗(yàn)室執(zhí)行摘要時(shí)將看到的片段大小。
限制摘要 - 接受 DNA 序列并返回常用限制性內(nèi)切酶切割位點(diǎn)的數(shù)量和位置。 如果您希望快速確定酶是否切割特定的 DNA 片段,請(qǐng)使用此程序。
反向翻譯 - 接受蛋白質(zhì)序列作為輸入,并使用密碼子使用表生成代表最可能的非簡(jiǎn)并編碼序列的 DNA 序列。 還返回源自每個(gè)氨基酸的所有可能密碼子的共有序列。 在設(shè)計(jì) PCR 引物以與相關(guān)物種的未測(cè)序編碼序列退火時(shí)使用反向翻譯。
翻譯 - 接受 DNA 序列并將其轉(zhuǎn)換為您指定的閱讀框中的蛋白質(zhì)。 Translate 支持整個(gè) IUPAC 字母表和幾個(gè)遺傳密碼。
序列圖:
顏色對(duì)齊保護(hù) - 接受一組對(duì)齊的序列(FASTA 或 GDE 格式)并為對(duì)齊著色。 該程序檢查每個(gè)殘基并將其與同一列中的其他殘基進(jìn)行比較。 序列中相同的殘基被賦予黑色背景,序列中相似的殘基被賦予灰色背景。 剩余的殘基得到白色背景。 您可以指定要應(yīng)用的著色必須相同和相似的殘基百分比。 使用 Color Align Conservation 增強(qiáng)序列比對(duì)程序的輸出。
顏色對(duì)齊屬性 - 接受一組對(duì)齊的序列(FASTA 或 GDE 格式)并為對(duì)齊著色。 該程序檢查每個(gè)殘基并將其與同一列中的其他殘基進(jìn)行比較。 序列中相同或相似的殘基被賦予彩色背景。 顏色是根據(jù)殘留物的生化特性來(lái)選擇的。 您可以指定要應(yīng)用的著色必須相同和相似的殘基百分比。 使用顏色對(duì)齊特性突出顯示具有保守生化特性的蛋白質(zhì)區(qū)域。
DNA組 - 調(diào)整 DNA 序列的間距并添加編號(hào)。 您可以指定組大?。拷M的堿基數(shù))以及每行的堿基數(shù)。 這個(gè)程序的輸出可以作為一個(gè)方便的參考,因?yàn)榫幪?hào)和間距可以讓你快速定位特定的堿基。
蛋白質(zhì)組 - 調(diào)整蛋白質(zhì)序列的間距并添加編號(hào)。 您可以指定組大小(每組的殘基數(shù))以及每行的殘基數(shù)。 這個(gè)程序的輸出可以作為一個(gè)方便的參考,因?yàn)榫幪?hào)和間距可以讓你快速定位特定的殘基。
第一張地圖 - 接受 DNA 序列并返回顯示 PCR 引物退火位置的文本圖。 還可以顯示限制性內(nèi)切酶切割位點(diǎn)和 DNA 序列的蛋白質(zhì)翻譯。 使用該程序生成有用的參考圖,特別是當(dāng)您為特定模板設(shè)計(jì)了大量引物時(shí)。 Primer Map 支持整個(gè) IUPAC 字母表和幾個(gè)遺傳密碼。
限制地圖 - 接受 DNA 序列并返回顯示限制性內(nèi)切酶切割位點(diǎn)位置的文本圖。 在您指定的閱讀框中,還給出了 DNA 序列的翻譯。 計(jì)劃克隆策略時(shí),請(qǐng)使用該程序的輸出作為參考。 Restriction Map 支持整個(gè) IUPAC 字母表和幾個(gè)遺傳密碼。
翻譯圖 - 接受 DNA 序列并返回顯示蛋白質(zhì)翻譯的文本圖。 可以指定翻譯的閱讀框(1、2、3 或全部三個(gè)),也可以選擇將大寫文本作為閱讀框。 Translation Map 支持整個(gè) IUPAC 字母表和幾個(gè)遺傳密碼。
隨機(jī)序列:
突變 DNA - 將堿基變化引入 DNA 序列。 您可以選擇要引入的突變數(shù)量,以及是否保留序列中的第一個(gè)和最后三個(gè)堿基,以反映選擇作用以維持起始和終止密碼子。 每個(gè)突變的位置是隨機(jī)選擇的,單個(gè)位點(diǎn)可以發(fā)生多個(gè)突變。 突變序列可用于評(píng)估序列分析結(jié)果的重要性。
突變蛋白質(zhì) - 將殘基變化引入蛋白質(zhì)序列。 您可以選擇要引入的突變數(shù)量,以及是否保留序列中的第一個(gè)殘基,以反映選擇作用以維持起始密碼子。 每個(gè)突變的位置是隨機(jī)選擇的,單個(gè)位點(diǎn)可以發(fā)生多個(gè)突變。 突變序列可用于評(píng)估序列分析結(jié)果的重要性。
隨機(jī)編碼 DNA - 生成以起始密碼子開(kāi)始并以終止密碼子結(jié)束的隨機(jī)開(kāi)放閱讀框。 您可以選擇要使用的遺傳密碼和要生成的序列長(zhǎng)度。 隨機(jī)序列可用于評(píng)估序列分析結(jié)果的重要性。
隨機(jī) DNA 序列 - 生成您指定長(zhǎng)度的隨機(jī)序列。 隨機(jī)序列可用于評(píng)估序列分析結(jié)果的重要性。
隨機(jī) DNA 區(qū)域 - 用隨機(jī)堿基替換 DNA 序列區(qū)域。 隨機(jī)序列可用于評(píng)估序列分析結(jié)果的重要性。
隨機(jī)蛋白質(zhì)序列 - 生成您指定長(zhǎng)度的隨機(jī)序列。 隨機(jī)序列可用于評(píng)估序列分析結(jié)果的重要性。
隨機(jī)蛋白質(zhì)區(qū)域 - 用隨機(jī)殘基替換蛋白質(zhì)序列區(qū)域。 隨機(jī)序列可用于評(píng)估序列分析結(jié)果的重要性。
樣本 DNA - 從指導(dǎo)序列中隨機(jī)選擇堿基,直到構(gòu)建出您指定長(zhǎng)度的序列。 每個(gè)選定的堿基都被替換,以便可以再次選擇它。
樣品蛋白質(zhì) - 從指導(dǎo)序列中隨機(jī)選擇堿基,直到構(gòu)建出您指定長(zhǎng)度的序列。 每個(gè)選定的殘基都會(huì)被替換,以便可以再次選擇它。
洗牌 DNA - 隨機(jī)打亂 DNA 序列。 混洗序列可用于評(píng)估序列分析結(jié)果的重要性,特別是當(dāng)序列組成是重要考慮因素時(shí)。
洗牌蛋白 - 隨機(jī)打亂蛋白質(zhì)序列。 混洗序列可用于評(píng)估序列分析結(jié)果的重要性,特別是當(dāng)序列組成是重要考慮因素時(shí)。