中大機構典藏-NCU Institutional Repository-提供博碩士論文、考古題、期刊論文、研究計畫等下載:Item 987654321/7583
English  |  正體中文  |  简体中文  |  Items with full text/Total items : 80990/80990 (100%)
Visitors : 42389748      Online Users : 852
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
Scope Tips:
  • please add "double quotation mark" for query phrases to get precise results
  • please goto advance search for comprehansive author search
  • Adv. Search
    HomeLoginUploadHelpAboutAdminister Goto mobile version


    Please use this identifier to cite or link to this item: http://ir.lib.ncu.edu.tw/handle/987654321/7583


    Title: 指數與韋伯分佈遺失值之處理
    Authors: 楊棋全;Chi-Chuan Yang
    Contributors: 統計研究所
    Keywords: 遺失值;多重插補法;指數分佈;韋伯分佈;熱卡法;multiple imputation;missing value;hot deck;mse;Weibull distribution;Exponential distribution
    Date: 2004-06-03
    Issue Date: 2009-09-22 11:00:20 (UTC+8)
    Publisher: 國立中央大學圖書館
    Abstract: 依照Rubin的分類,處理遺失值可分為(1)完整的觀察體分析(complete-case analysis)(2)加權法(weight)(3)插補法(imputation)及(4)模式建構法四種方法。 在工業裡,指數與韋伯分佈是較常使用的統計模型,主要是用於表示產品的壽命。但是在收集資料同時,難免會遇到數據收集不到的情況,產生了遺失值。一般企業的作法為採用可觀測的資料來作決策,也就是將遺失資料刪除,一旦可觀測資料過少時,這些可觀測的資料是否值得相信?所作成的決策是否可信賴?這是令人質疑的地方。所以必須要有與其它遺失資料處理的一個比較方法,才能引導決策者正確下決策。 本文將重點放到指數與韋伯分佈遺失值插補法的比較,其中,數種插補法為本文首度提出,例如類似信賴區間插補法、類似預測區間插補法、分位數插補法、修正的分位數插補法、機率圖、附帶額外變異的機率圖。有些插補方法來自於Little與Rubin(2002)的著作,例如平均數插補法、熱卡法。還有一些來自於Wang與Rubins(1998)發表的結果。至於中位數插補法,本文針對韋伯分佈另外提出一種新的插補構想。此外,本文也將插補的結果與(1)完整的觀察體分析(complete-case analysis)及(4)模式建構法作一番比較。其中,完整的觀察體分析採用不同的參數估計量,例如MLE、動差法估計量、最小平方法估計量、廣義最小平方法估計量、絕對誤差估計量。模式建構法,則主要採用EM插補法。 比較的過程中,本文假設資料原本應該有n個,現在可觀測值有s個,遺失值有n-s個。採用多重插補法中,假設插補次數共有m次。本文分別考慮遺失比率(1-s/n)為20%、50%、80%,輔助樣本數(n)分別為10、20、40、60、80、100,搭配插補次數(m)為1?20、40、60、100,比較不同插補法的優缺點。比較的準則,主要是採用參數估計量的mse(mean square error),估計量的mse越小,表示該項方法越好。此外,針對插補方法,本文還採用一些評價指標作比較,另外也提出新的評價指標。這個動作主要是比較遺失資料插補前的數值與插補後的數值的差異。若比較結果差異為最小,表示此插補方法為還原遺失資料的最佳方法。 從參數估計量mse的比較上,可以得到本文所提的中位數插補法與分位數插補法在樣本數60以下為指數分佈下最佳的參數估計量;對於韋伯分佈,本文所提出的類似預測區間插補法、中位數插補法、修正的中位數插補法、修正的分位數插補法、附帶額外變異的機率圖在不同的樣本情況下,皆獲得不錯的成效。對於多重插補法次數m的決定,本文的結果建議要增加Rubin所建議的5~12次到8~20次,這樣才會獲得比較穩定的參數mse值。 除此之外,在常態分佈下,李興南(2002)證明出Rubin所提出的多重插補參數估計量的變異數估計量是不偏的估計量,代表此變異數估計量是適合的,但是本文在指數分佈下,證明出此變異數的估計量並非不偏,所以Rubin所提的變異數估計量並不是對任何分佈皆適用。
    Appears in Collections:[Graduate Institute of Statistics] Electronic Thesis & Dissertation

    Files in This Item:

    File SizeFormat


    All items in NCUIR are protected by copyright, with all rights reserved.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明