提高實驗測量效果的能力
Sandra Slutz博士,科學伙伴科學家
Kenneth L. Hess,科學伙伴創始人兼總裁
所有實驗觀察結果都是信號,變量對結果的真實影響以及噪聲(實驗技術中固有的隨機誤差)的組合。在設計和分析實驗時,目標是最大化信噪比,以便您可以得出準確的結論。增加信噪比的六種常用方法是:
重復測量一個項目,
增加樣本量,
隨機化樣本,
隨機化實驗,
重復實驗,和
包括協變量。
很少將任何一個科學問題本身借給利用這些信號與噪聲降低技術全部六個,但最大限度地提高結果的準確性,你應該嘗試盡可能多的這些作為合并合理地融入你的實驗設計。成本,時間和資源可用性將有助于決定哪些技術可行,哪些技術不可行。下面的表1概述了每種技術最有用的場景類型。
定量變量 | |||
提高信噪比的技術 | 它是什么? | 什么時候有用? | 何時使用它的示例 |
重復測量 | 單次測量單個項目或事件以消除測量中的錯誤。 對單個事件的更多測量可以更有信心計算準確的平均測量值。 | 如果單個測量可能有很多變化,則特別有用; 因為它必須快速制作,很難確定確切的終點,或者在技術上很難,因此容易出錯。 如果測量是明確的,則不會增加價值,例如關于人的年齡或以米為單位測量房間尺寸的調查問題的答案。 |
|
增加樣本量 | 增加從中收集數據的項目或人員數量會增加您觀察到的內容指示整個人口的概率。 可以進行計算以確定樣本大小需要多大。有關更多詳細信息,請參閱有關確定調查的最佳樣本量的指南。 | 當你試圖得出關于整個人口的結論時,特別有用。 如果您的結論旨在針對個人或單個項目,則不適用。 |
|
樣本隨機化 | 使用抽獎系統將樣本分配給給定實驗中的不同實驗組和對照組有助于使組的起始組成盡可能相等,即使對于您可能忽略的變量也是如此。 一些實驗可以完全隨機化; 其他涉及首先阻止。阻止允許創建同源組,如男性與女性,然后在塊內隨機化。當研究人員懷疑實驗對象之間可能存在科學上重要的差異時,就會進行這種變化。 | 當您從中抽取樣本的人群(這是您想要得出結論的人口)時,尤其重要。 如果您需要對人口進行分層,可能不適用,因為您希望能夠對每個子組得出不同的結論。例如,藥物研究中的男性與女性或電路設計中的不同類型的電阻器。 |
|
隨機化實驗 | 使用彩票系統來確定執行相關實驗的順序,而不是依賴于可能引入其他被忽視的變量的明顯邏輯順序。 | 當您進行相關實驗時,尤其關鍵,您將從中得出單個元結論。 適用于使用相同設備連續完成的相關實驗,以及在不同設備上并行完成的相關實驗。 |
|
重復實驗 | 不止一次重復實驗有助于確定數據是否是僥幸,或代表正常情況。它有助于防止在沒有足夠證據的情況下跳出結論。 重復次數取決于許多因素,包括數據的傳播和資源的可用性。三次重復通常是評估數據傳播的良好起點。 | 重復實驗是大多數領域的標準科學實踐。例外情況通常是實驗的規模和成本使其無法實現。例如,在罕見的醫學條件下的藥物試驗,大規模的社會學實驗,以及罕見現象的天文觀察。 |
|
包括協變量 | 一些現象由多個變量控制。結果往往是這些協變量的總和。在對這些類型的現象進行建模或分析有關它們的數據時,最好將所有協變量包含在分析和/或模型中。這樣可以最全面地了解正在發生的情況。 | 如果您正在研究一個復雜現象,其結果取決于多個因素的總和,那么包括協變量是有幫助的。如果您無法嚴格控制所有變量,則尤為必要。例如,在藥物研究,氣候數據或食物鏈和生態系統分析中處理患者時。 |
|
表1.最大化信噪比的六種最常用方法。
重復測量
對單個項目進行重復測量是一種強大但有限的技術。在測量具有挑戰性的情況下,例如在觀察和記錄液體完全蒸發的確切時刻的情況下,它是非常有用的。在這些情況下,平均多次測量有助于消除測量誤差。查看各個測量的范圍和變化 - 例如,通過繪制所有測量 - 甚至可以幫助您確定測量技術是否足夠或者過于不穩定而無法依賴。但是,如果測量結果簡單明了,比如將沙袋稱重到最接近千克的尺度,則重復測量不會增加任何價值,而是浪費時間和資源。
增加樣本量
增加樣本量是減少實驗噪音的最常見方法之一。樣本大小是指您在單個實驗中進行測量或觀察的項目,事件或人員數量。通常,實驗中樣本量越大,通過更改變量檢測效果的功率(概率)就越大。樣本大小到底有多大?您可以使用功效分析計算來確定有效的樣本量。樣本量:我需要多少調查參與者? 指南包括一些開始計算。其他解釋和計算可以在統計教科書中找到,如參考書目中列出的那些(見下文)功耗分析了解更多)。但根據經驗,預期效果越小,您應該計劃收集的樣本量越大。例如,如果你確定了男性和女性之間的生物學差異,那么10個男性和10個女性的樣本量足以看出男性有一條X染色體而女性有兩條,但是太小而無法確定男性是平均而言,比女性高。同樣,您在給定實驗中測試的變量越多,您應評估的樣本數量就越多
隨機化(樣本和實驗)
即使他們認識到所有潛在的變異來源,科學家也幾乎不可能控制實驗中的所有因素。溫度,位置,設備或其他物理條件的微小差異可能導致實驗偏差(一種結果優于另一種結果)和噪音。通過隨機化可以減少實驗偏差和噪聲。樣本和實驗都可以隨機化,盡管在單個科學項目中并不總是可以使用這兩種策略。在樣本隨機化期間,通過抽簽將測試對象分配給各種對照或實驗組。例如,在研究新的飲食方案時,受試者將被隨機分配到陰性對照組,在那里他們沒有節食,陽性對照組,他們使用任何飲食方案被認為是黃金標準(即目前已知的最佳飲食),以及實驗組,他們使用新的飲食方案。相反,如果允許受試者選擇他們想要的群體,他們可能會偏向結果。愿意選擇“無飲食”組的人可能傾向于吃更多的飯菜,或者選擇遵循黃金標準飲食的人可能更有運動感。這些可能性中的任何一種,即消費更多食物或鍛煉更多的傾向,都可能會扭曲結果。但是如果受試者是隨機分配的,那么這些差異可能會分布在所有實驗組和對照組中,因此,實驗結果并沒有明顯偏差。
實驗隨機化可以應用于存在一系列測試的情況,其中測試的順序可以通過抽獎來確定。在這些類型的情況下,它可用于減少數據中的意外偏差。例如,如果目標是找出普通成年人可承受的酸味的水平,則每個成年受試者將被給予一系列口味的明膠,每種明膠具有不同的酸味強度。然后測試對象將評估他們發現哪些明膠可以忍受并且太酸而不能吃。如果測試對象全部給予明膠味道,則以酸強度的遞增順序,結果將是人為膨脹的平均酸耐受性。為什么?因為系統地增加對酸味的暴露會使受試者的味蕾暫時脫敏,從而影響酸味。
重復實驗
重復實驗也會導致信噪比的增加。分析實驗重復可以減少虛假效應(如略微升高的環境溫度或讀數太高的機器)推動結論的可能性。來自樣品的數據在單個實驗中一起收集; 重復實驗需要獨立,這意味著應該改變實際可能的許多實驗參數:不同的樣品,不同的機器,不同的日子,不同的實驗者等。通常認為實驗的三次重復是最小的。為什么?有兩個原因,第一個原因是三個重復確保平均結果比單個實驗更準確的三分之二(66%)概率。三分之二可能看起來不是很多,但重復的回報減少 - 超過三個,你必須做更多的重復,以大大增加信心。即使有500次重復,單次試驗恰好比平均值更接近真實值的可能性很小。有關詳細信息,請參見下面的表2。第二個原因是有三次重復,您有一個很好的基礎來繪制和使用統計描述,如均值和平均值的標準誤差,來評估您的數據,看看結果是否足夠強大,可以得出結論,或者您是否需要收集更多數據。在某些情況下,由于資源限制,無法重復實驗。例如,對亞馬遜雨林等大片土地的生物調查只會進行一次。如果無法進行重復,則確保樣本量足夠大至關重要。對亞馬遜雨林等大片土地進行的生物調查只能進行一次。如果無法進行重復,則確保樣本量足夠大至關重要。對亞馬遜雨林等大片土地進行的生物調查只能進行一次。如果無法進行重復,則確保樣本量足夠大至關重要。
實驗重復數 | %重復的平均值比單次試驗更準確 |
2 | 60.8 |
3 | 66.7 |
4 | 70.5 |
五 | 73.2 |
10 | 80.5 |
20 | 86.0 |
40 | 90.0 |
100 | 93.7 |
162 | 95.0 |
500 | 97.2 |
表2.重復實驗幾次導致重復的平均值
比實驗的單次試驗更準確的統計機會大大增加,但隨后的重復具有遞減的回報。
(表格改編自Gauch,2006年。見基礎理論的原始文本。)
包括協變量
許多自然系統和科學現象是許多因素的總和效應。這些因素稱為協變量因為它們“共同變化”,共同控制最終結果。盡管科學家們常常對評估改變單個因素如何影響整個系統感興趣,但建立一個只能改變和評估一個變量的實驗可能是不切實際的,甚至是不可能的。例如,如果您想預測建造一個新的汽車制造廠將如何影響當地的空氣質量,一種方法是確定工廠將貢獻多少空氣污染。但這種模式是不精確的。構建新工廠時可能會發生其他相關事件。例如,工廠將創造就業機會,更多人可能會遷移到該地區以利用這些工作。這些人會購買當地房屋,開車,開辦相關行業等等。所有這些事件也會影響當地的空氣質量。因此,更準確的評估將盡可能多地考慮協變量。
考慮協變量也有助于提高檢測變化的能力。例如,假設您正在進行一項關于新藥降低膽固醇的能力的研究。膽固醇水平由許多因素決定,包括:性別,年齡,家族史,飲食,體力活動和體重。在一項關于小鼠的研究中,你可以控制所有這些因素 - 你可以讓老鼠具有相同的遺傳,同樣的年齡和性別,喂養相同的飲食,體重相同的量,并執行相同的鍛煉制度。但是,與人類進行類似的完全對照研究是不可能的。您嘗試控制的每個因素,您的研究人員越少,招募科目就越困難。另一種方法是僅限制一些變量,并測量剩余的協變量,以便將它們納入最終的數據分析模型。使用該模型,您可以在數學上減去協變量的影響,并仍然可以看到您感興趣的變量的影響:降膽固醇藥物。
參考書目
這些資源提供了有關如何設計實驗和提高科學數據中信噪比的其他信息:
安德森,MJ和安德森,惠普(1993年,7月/ 8月)。將DOE應用于微波爆米花。PI質量。2009年8月25日檢索自 http://www.statease.com/pubs/popcorn.pdf
Gauch,HG,Jr。贏得準確性游戲。美國科學家 94,2,133。
Khare,R。(nd)。三個羅密歐與朱麗葉:我們早期的實驗設計。2009年8月25日檢索自 http://www.symphonytech.com/articles/romeos.htm
Trochim,WMK(2006年)。設計簡介。研究方法知識庫。2009年8月25日檢索自 http://www.socialresearchmethods.net/kb/desintro.php
Wilson,EB 紐約科學研究導論:Dover Publications,Inc。