前參議員喬治·J·米切爾(George J. Mitchell)提交報告指出羅傑·克萊門斯(Roger Clemens)等其他80多位美國職業棒球大聯盟(Major League Baseball)球員使用違禁藥品以提高自己在球場上的表現。與此同時,這位前賽揚獎(Cy Young)得獎投手繼續為自己進行辯護以證清白。在克萊門斯提交國會山立法者的證詞中,還包括了一份由一家市場行銷機構根據統計數位所撰寫的長篇累牘的報告,以求證實克萊門斯的無辜。
但沃頓商學院的四位教授在2月10日出版的《紐約時報》(New York Times)上聯合撰文表達了另一種觀點:統計分析的有效性只適用於其中的組成個體。這一論點將會得到更多的重視,因為今天的機構和個人都試圖在那些越來 越龐大、複雜和密集的信息量中獲取意義。
“現在,資訊的消費者們都深陷資料之中,” 沃頓商學院商業與公共政策教授札斯廷·沃爾弗斯(Justin Wolfers)說。“對企業、工人、政府和其他活動所進行的不斷測量產生了大量的資料,並且存在眾多的方法來從原始資料中得出結論。遺憾的是大部分方法 都引向了錯誤的方向。”
他舉例說,零售連鎖商店可能會對其一段時間內的運營情況進行 分析,並且發現他們降低銷售價格的時間段正好和整體銷量下滑的時間段相一 致。“那可能會讓這家連鎖店得出結論說低價會導致銷量的減少,”沃爾弗斯說。“但可能存在真正的更深入的因果關係。在這家零售商計畫提高價格以促進銷量之 前,他們應該對其他因素進行分析,以明確在那段時間內整體需求是否受到其他因素的影響。例如,也許該公司在滯銷時期內正好在進行半年度的促銷活動。如果是 這樣的話,那是低銷量導致了價格下滑,而不是價格降低導致了銷量下滑。”
沃爾弗斯稱 這正說明了將統計分析應用到商業、社會科學和其他領域所存在的固有的關鍵性難點。“當研究者面對實驗或自然科學資料時—— 如醫學——隔離和排除無關資料一般來說相比更容易,”他指出說,“在實驗中,制藥公司可以隨機將藥物使用到一組實驗物件上,並且將無效對照劑應用到另一組 物件上。如果研究人員在挑選藥物的實驗物件上遵循了隨機的原則,那麼他們可以分別得出關於藥物或無效對照劑效果的結論。”
但要應用在商業環境並非那麼容易。“在連鎖商店的案例中,要孤立出其他種種因素的影響更加困難,”沃爾弗斯說。關於銷售價格的變化,“有必要考慮天晴或下雨,或者天氣炎熱和寒冷等因素對銷量和購物者行為的影響。”
沃爾弗斯與沃頓的統計學教授謝恩·延森(Shane Jensen)、亞伯拉罕·懷納(Abraham Wyner),以及市場行銷學教授埃裏克·布萊特勞(Eric Bradlow)共同撰寫了《紐約時報》上這篇關於羅傑·克萊門斯案件的文章。文章的標題為《支持克萊門斯的報告對資料進行了精心挑選》(Report Backing Clemens Chooses Its Facts Carefully)。
亨德里克體育管理公司(Hendricks Sports Management)撰寫了那份報告以支持克萊門斯所宣稱的未使用任何類固醇藥物。但在《紐約時報》的文章中,學者們對該公司所採用的方法提出了質疑。 “在這份克萊門斯的報告中,他們企圖將克萊門斯與在1993年46歲時退役的諾蘭·萊恩(Nolan Ryan)進行對比,以將這件事情化解。”作者們寫道。“在這份對比中,克萊門斯的行為看起來沒什麼不一樣:兩者都在他們40多歲時收穫了巨大的成功。但 是如果將克萊門斯與另外兩位同時代的投手藍迪·詹森(Randy Johnson)和科特·席林(Curt Schilling)相比,也可以得出同樣的結論。”
沃頓商學院的研究人員們稱那些 對比並不完全。“報告僅僅將克萊門斯與那些在職業生涯第二階段獲得成功的投手相比較,而不是與那些同克 萊門斯一樣在最初就取得成功的所有投手相比較。通過這個方法,報告人為地縮小了克萊門斯的數字會顯得不正常的機率,”他們寫道,“統計學家將這個問題稱為 ‘選擇偏向’。”
沃頓商學院的研究者們認為,正如零售商需要在一個價格對比分析中考 慮其他選擇因素對銷售的影響一樣,克萊門斯的表現也應該同“所有職 業生涯持久的投手”進行對比。如果進行那個對比,克萊門斯在“事業第二春的表現就顯得不同尋常了”,他們寫道。大部分投手在他們職業生涯的早期的球場技藝 會穩步得到提高,並且在30歲達到高峰,之後表現會緩慢下滑。相反,克萊門斯的職業生涯在他20來歲後期就開始下滑,並且之後在他40多歲中期時得到了提 高。
沃頓商學院的研究者們指出,“雇傭統計學家”們傾向於選擇那些會對自己客戶有利的對比 物件。但如果分析結果不服務於任何特定觀點時, 統計分析會得到如何的使用呢?金融分析、計量經濟學、審計、生產和運營是其中的幾個領域。在這些領域,各利益方尋找無偏置的資料,以能夠在面對不確定性時 做出正確的決策。
可口可樂和共同基金
喝可口可樂就能減肥 嗎?這也是一場法律訴訟的中心問題。這場集體訴訟案所針對的是可口可樂公司生產的含咖啡因的綠茶飲料Enviga的 廣告宣傳。向新澤西州卡姆登聯邦地方法院(U.S. District Court)所提出的訴訟中稱,Enviga的廣告宣傳說“該產品能夠燃燒的熱量超過了飲料本身所含有的熱量,從而能夠減少人體熱量”。
訴狀稱可口可樂所宣稱的內容是基於“一份小型的短期研究的摘要,這次研究由可口可樂公司提供資金……”。訴訟檔稱該次臨床研究的對 像是相對偏瘦的個體,並且他們的平均體重指數(Body Mass Index,BMI)為22,但“絕大部分美國人都偏重或者肥胖,”他們的BMI達到了25甚至更高,他們很可能無法通過使用Enviga來達到減肥的效 果。但可口可樂的發言人稱公司的研究和其結果都是有效的。
另一個在統計方面頗具爭議 的案例是三月份《華爾街日報》(Wall Street Journal)上關於德萊弗斯基金(Dreyfus Funds)的廣告。北卡羅來納州三角研究中心(Research Triangle)的獨立統計顧問,也是美國統計協會(American Statistical Association)成員的大衛·彼得斯(David Peterson)說,廣告宣傳該公司中期收益基金(Intermediate Term Income Fund)在晨星(Morningstar)的評級中獲得了四星。
“廣告中小心地指出過去的業績並不代表未來,卻沒有指出德萊弗斯基金旗下至少有19支共同基金,”彼得斯說。“即使這19支基金本質上並沒有任何不一般的地方,其中最好的一支很可能一直都表現優秀。同樣,最差的一支——在廣告中並未提到——一般也會表現很差。”
他說,如果採用同樣的原則考慮問題,那麼制藥公司“可以就新藥的效果進行10次獨立的不相干的測試,然後僅僅使用最有效的那一次實驗結果來進行廣告宣傳。”
不信任與錯誤表達
沃頓商學院的延森教授說,在所有研究中,產生非故意誤差的機率同樣也引人擔憂。
“即使所選擇的樣本非常優秀,但也可能會產生令人誤解的結果,”他指出。“一個常見的問題就是資料挖掘。如果說分析一個大資料組的時間 足夠長,他們就肯定可以找到某些變數在統計學上具有的顯著效應,或者不同變數組之間的差別。”但他說,遺憾的是,研究者們經常只是簡單地報告他們個別顯著 的發現,而沒有提到“在他們得到那個結果之前進行了許多次效應不顯著的試驗”。
延森 認為,“對整個試驗流程進行適當的報告是有必要的,以保證各種類型的試驗結果都得到了表達。”但至少有兩股力量經常對效應分析產 生負面影響。“第一就是對統計分析的不信任,第二就是在學院派統計學家和實踐者之間缺乏對話。”延森說。實際上,“我曾閱讀了眾多在醫藥、經濟和社會科學 領域的研究,如果他們能夠與統計學家就所收集資料的分析,以及資料收集本身進行更多的探討,這些研究就能夠從中受益。”
布萊特勞同樣對統計結果的闡述表達了擔憂。“我經常告訴自己的學生說以資料為驅動的解決方案不一定能告訴你正確的答案。相反,他們能 夠告訴你可以排除哪些(答案),因為資料無法支援那些答案。”統計分析的真正價值在於能幫助使用者正確地辨別不確定性而不是“最佳猜測”,以瞭解哪些結果 具有統計顯著性,並且能就特定的假設情況給出答案。
“關鍵問題就在於代表性,”他說。他再次回到關於羅傑·克萊門斯的研究。“研究者們和使用者們應該關心資料是如何取得的,這些資料是否是通過隨機抽樣獲得。如果不是,那麼就應該小心其研究結論了。”
布萊特勞認為即使研究人員沒有任何預謀,也應該對其研究結果持謹慎態度。“在20世紀90年代末期,我們在一個具有20年歷史的公墓收 集人口資料。資料顯示相比於埋葬在該公墓內多年的人,那些埋葬時間較晚(即越靠近研究時間)的人平均死亡年齡較小,” 布萊特勞說。他將研究結果寫入了一篇為《機率》雜誌(Chance)所撰寫的文章:《異象選擇談》(A Selection of Selection Anomalies)。
“資料很容易讓人得出結論說年輕人的死亡率已經提高,但這個結論並不正確。”相反,他指出,如果對該研究中的資料進行分析,就會發現在公墓內所葬人群的樣本必定會更多地包括那些較年輕死亡的人,這只是因為他們的出生日期更靠近調查日期,而死亡年齡只是參數之一。
沃爾弗斯認為要減少統計學上的錯誤使用,關鍵在於直覺的合理性,或者對研究者所使用的方法以及對各種力量之間的相互影響的瞭解。“重要的是瞭解在不同變數之後的驅動因素,”他說,“只有在瞭解這些之後,研究者才能更好地理解和建立因果關係。”
延森舉了另外一個例子。“我正在參與一個為美國職業棒球大聯盟外野手的守備能力建立模型的研究。研究中的一種假設是說如果球被擊到他們 身後的話,外野手的守備會更加困難,因為這樣他們必須倒退地奔跑,而如果球被擊到他們前方的話,他們只需要向前奔跑,這樣會相比更加容易。”
但是研究結果與所假設的情況相反:在任何給定距離下,外野手倒退奔跑能接住更多的球。“這個結果看上去完全違背我們的直覺,”延森 說。“但如果考慮到滯空時間(即球在空中停留的時間)你就會覺得合理了。因為球被擊打得更遠,那麼它在空中停留的時間就會越長,這樣外野手就會有更多的時 間來接球,即使球被擊打到他們的身後。這是一個很有意思的案例,因為案例中資料清楚地表明瞭我們之前推理所存在的缺點。”
http://www.ceconline.com/ART_8800051100_130000_MA_02.HTM
留言列表