ARIMA (p, d, q) สมการพยากรณ์: แบบจำลอง ARIMA เป็นทฤษฎีในชั้นเรียนทั่วไปของแบบจำลองสำหรับการคาดการณ์ชุดเวลาซึ่งสามารถทำให้เป็น 8220stationary8221 โดย differencing (ถ้าจำเป็น) อาจ ร่วมกับการแปลงที่ไม่ใช่เชิงเส้นเช่นการบันทึกหรือการลดน้ำหนัก (ถ้าจำเป็น) ตัวแปรสุ่มที่เป็นชุดเวลาจะหยุดนิ่งถ้าคุณสมบัติทางสถิติมีค่าคงที่ตลอดเวลา ชุดเครื่องเขียนมีแนวโน้มไม่มีรูปแบบแตกต่างกันไปโดยเฉลี่ยมีความกว้างคงที่และเลื้อยตามแบบที่สม่ำเสมอ กล่าวคือรูปแบบเวลาแบบสุ่มระยะสั้น ๆ มีลักษณะเหมือนกันในเชิงสถิติ เงื่อนไขหลังหมายความว่า autocorrelations (correlations กับความเบี่ยงเบนก่อนจากค่าเฉลี่ย) คงที่ตลอดเวลาหรือเทียบเท่าที่สเปกตรัมพลังงานคงที่ตลอดเวลา ตัวแปรสุ่มของแบบฟอร์มนี้สามารถดูได้ (ตามปกติ) เป็นสัญญาณและเสียงรวมกันและสัญญาณ (ถ้ามีปรากฏชัด) อาจเป็นรูปแบบการพลิกกลับค่าเฉลี่ยอย่างรวดเร็วหรือช้าหรือการสั่นของไซน์โซลาร์หรือการสลับสัญญาณอย่างรวดเร็ว และอาจมีส่วนประกอบตามฤดูกาล แบบจำลอง ARIMA สามารถดูได้ว่าเป็น 8220filter8221 ที่พยายามแยกสัญญาณออกจากเสียงและสัญญาณจะถูกอนุมานในอนาคตเพื่อให้ได้การคาดการณ์ สมการพยากรณ์ ARIMA สำหรับชุดเวลาแบบคงที่คือสมการเชิงเส้น (สมการถดถอย) ซึ่งตัวทำนายประกอบด้วยความล่าช้าของตัวแปรขึ้นอยู่กับและความล่าช้าของข้อผิดพลาดในการคาดการณ์ นั่นคือค่าที่คาดการณ์ของ Y คงที่และเป็นผลรวมถ่วงน้ำหนักของหนึ่งหรือมากกว่าค่าล่าสุดของ Y และหรือผลรวมถ่วงน้ำหนักของค่าข้อผิดพลาดล่าสุดหนึ่งค่าหรือมากกว่า ถ้าตัวทำนายประกอบด้วยค่า lag ที่ต่ำสุดของ Y มันเป็นโมเดล autoregressive บริสุทธิ์ (8220 self-regressed8221) ซึ่งเป็นเพียงกรณีพิเศษของรูปแบบการถดถอยและสามารถใช้กับซอฟต์แวร์การถดถอยแบบมาตรฐาน ตัวอย่างเช่นโมเดล autoregressive (8220AR (1) 8221) คำสั่งแรกสำหรับ Y เป็นรูปแบบการถดถอยแบบง่ายซึ่งตัวแปรอิสระมีเพียง Y lagged โดยหนึ่งช่วงเวลา (LAG (Y, 1) ใน Statgraphics หรือ YLAG1 ใน RegressIt) หากตัวทำนายบางตัวมีข้อผิดพลาดข้อผิดพลาดโมเดล ARIMA ไม่ใช่แบบจำลองการถดถอยเชิงเส้นเพราะไม่มีวิธีใดที่จะระบุข้อผิดพลาด 8222last period8217s error8221 เป็นตัวแปรอิสระ: ข้อผิดพลาดต้องคำนวณเป็นระยะ ๆ เป็นระยะ ๆ เมื่อโมเดลพอดีกับข้อมูล จากมุมมองด้านเทคนิคปัญหาเกี่ยวกับการใช้ข้อผิดพลาดที่ล่าช้าเป็นตัวพยากรณ์คือการคาดการณ์ model8217s ไม่ใช่หน้าที่เชิงเส้นของค่าสัมประสิทธิ์ แม้ว่าจะเป็นฟังก์ชันเชิงเส้นของข้อมูลที่ผ่านมา ดังนั้นค่าสัมประสิทธิ์ในแบบจำลอง ARIMA ที่มีข้อผิดพลาดที่ล้าหลังต้องถูกประมาณโดยวิธีการเพิ่มประสิทธิภาพแบบไม่เชิงเส้น (8220hill-climbing8221) แทนที่จะใช้เพียงการแก้สมการของสมการ ตัวย่อ ARIMA ย่อมาจาก Auto-Regressive Integrated Moving Average ความล่าช้าของชุดเครื่องเขียนในสมการพยากรณ์ถูกเรียกว่า quotautoregressivequot terms ความล่าช้าของข้อผิดพลาดในการคาดการณ์จะเรียกว่า quotmoving averagequot terms และชุดข้อมูลเวลาที่จะต้องมีความแตกต่างกันไปเพื่อที่จะทำให้ stationary ถูกกล่าวว่าเป็นชุด stationary ที่ไม่มีการเปลี่ยนแปลง โมเดลแบบสุ่มและแบบสุ่มแนวโน้มโมเดลอัตถิภาวนิยมและแบบจำลองการทำให้เรียบเป็นแบบเอกเทศเป็นกรณีพิเศษของแบบจำลอง ARIMA (p, d, q) quotario ซึ่งโดย: p คือจํานวนเงื่อนไขเชิงอัตรกรรม (autoregressive terms), d คือจํานวนความแตกต่างที่ไม่จำเป็นสำหรับ stationarity และ q คือจํานวนข้อผิดพลาดในการคาดการณ์ที่ล้าหลังใน สมการทำนาย สมการพยากรณ์ถูกสร้างขึ้นดังนี้ อันดับแรกให้ y แสดงความแตกต่าง d ของ Y ซึ่งหมายถึง: โปรดทราบว่าความแตกต่างที่สองของ Y (กรณี d2) ไม่ใช่ความแตกต่างจาก 2 ช่วงก่อนหน้า ค่อนข้างแตกต่างแรกของความแตกต่าง ซึ่งเป็นอนาล็อกแบบไม่ต่อเนื่องของอนุพันธ์ลำดับที่สองนั่นคือการเร่งความเร็วในท้องถิ่นของซีรีส์มากกว่าแนวโน้มในท้องถิ่น ในแง่ของ y สมการพยากรณ์ทั่วไปคือที่นี่มีการกำหนดค่าพารามิเตอร์เฉลี่ยเคลื่อนที่ (9528217s) เพื่อให้สัญญาณของพวกเขามีค่าเป็นลบในสมการดังต่อไปนี้ตามข้อเสนอของ Box and Jenkins ผู้เขียนบางคนและซอฟต์แวร์ (รวมถึงภาษาการเขียนโปรแกรม R) กำหนดไฟล์เหล่านั้นเพื่อให้มีเครื่องหมายบวกแทน เมื่อจำนวนจริงถูกเสียบเข้ากับสมการไม่มีความคลุมเครือ แต่สำคัญมากที่ทราบว่าการประชุมซอฟต์แวร์ของคุณใช้เมื่อคุณอ่านผลลัพธ์ บ่อยครั้งที่พารามิเตอร์จะแสดงด้วย AR (1), AR (2), 8230 และ MA (1), MA (2), 8230 เป็นต้นเพื่อระบุรูปแบบ ARIMA ที่เหมาะสมสำหรับ Y คุณจะเริ่มต้นด้วยการกำหนดลำดับของ differencing (d) จำเป็นต้องจัดลำดับชุดและลบคุณลักษณะขั้นต้นของฤดูกาลอาจเป็นผลมาจากการเปลี่ยนแปลงความแปรปรวน - เสถียรภาพเช่นการบันทึกหรือการลดราคา ถ้าคุณหยุดอยู่ที่จุดนี้และคาดการณ์ว่าซีรี่ส์ที่แตกต่างกันคือค่าคงที่คุณได้ติดตั้งแบบสุ่มหรือแบบจำลองแนวโน้มแบบสุ่มเท่านั้น อย่างไรก็ตามชุดเครื่องเขียนอาจมีข้อผิดพลาดที่อาจเกิดขึ้นได้เองซึ่งหมายความว่าคำจำกัดความของ AR บางข้อ (p 8805 1) และบางคำจำนวน MA (q 8805 1) ยังจำเป็นในสมการพยากรณ์ ขั้นตอนการกำหนดค่าของ p, d และ q ที่ดีที่สุดสำหรับชุดเวลาที่กำหนดจะกล่าวถึงในส่วนถัดไปของบันทึกย่อ (ซึ่งลิงก์อยู่ที่ด้านบนของหน้านี้) แต่เป็นการแสดงตัวอย่างบางส่วนของประเภท ของแบบจำลอง ARIMA แบบไม่ใช้เชิงเส้นที่มักพบคือด้านล่าง ARIMA (1,0,0) แบบจำลองอัตถดถอยอันดับแรก: ถ้าซีรี่ส์มีตำแหน่งนิ่งและสัมพันธ์กันอาจเป็นไปได้ว่าเป็นค่าหลายค่าของตนเองก่อนหน้าบวกค่าคงที่ สมการพยากรณ์ในกรณีนี้คือ 8230 ซึ่งเป็น Y ที่ถดถอยลงบนตัวของมันเองที่ล้าหลังไปหนึ่งช่วงเวลา นี่คือโมเดล 8220ARIMA (1,0,0) คงที่ 8221 ถ้าค่าเฉลี่ยของ Y เป็นศูนย์จะไม่มีการรวมค่าคงที่ ถ้าค่าสัมประสิทธิ์ความลาดชัน 981 1 เป็นค่าบวกและน้อยกว่า 1 ในขนาด (ต้องมีขนาดน้อยกว่า 1 ในกรณีที่ Y อยู่นิ่ง) รูปแบบนี้อธิบายถึงพฤติกรรมการคืนค่าเฉลี่ยซึ่งคาดว่าจะมีการคาดการณ์มูลค่า 8282 ของช่วงถัดไปเป็น 981 1 เท่าตาม ห่างไกลจากค่าเฉลี่ยเป็นค่า period8217s นี้ ถ้า 981 1 เป็นค่าลบจะคาดการณ์พฤติกรรมการคืนค่าเฉลี่ยด้วยการสลับสัญญาณซึ่งก็คือคาดการณ์ว่า Y จะอยู่ต่ำกว่าระยะเวลาถัดไปหากอยู่เหนือค่าเฉลี่ยในช่วงเวลานี้ ในแบบจำลองอัตถิภาวนิยมที่สอง (ARIMA (2,0,0)) จะมีระยะ Y t-2 อยู่ด้านขวาเช่นกันและอื่น ๆ ขึ้นอยู่กับสัญญาณและ magnitudes ของค่าสัมประสิทธิ์แบบ ARIMA (2,0,0) สามารถอธิบายระบบที่มีการพลิกกลับค่าเฉลี่ยที่เกิดขึ้นในรูปแบบการสั่น sinusoidally เช่นการเคลื่อนไหวของมวลในฤดูใบไม้ผลิที่อยู่ภายใต้แรงกระแทกแบบสุ่ม . ARIMA (0, 0) การเดินแบบสุ่ม: ถ้าชุด Y ไม่อยู่นิ่งแบบจำลองที่ง่ายที่สุดที่เป็นไปได้คือรูปแบบการเดินแบบสุ่มซึ่งถือได้ว่าเป็นรูปแบบ AR (1) ที่มีข้อ จำกัด ในการกำหนดอัตลักษณ์เชิงอัตรกรรม ค่าสัมประสิทธิ์เท่ากับ 1 คือชุดที่มีการพลิกกลับหมายถึงช้าอย่างไม่หยุดนิ่ง สมการทำนายสำหรับแบบจำลองนี้สามารถเขียนได้ว่า: โดยที่ระยะคงที่คือการเปลี่ยนแปลงระยะเวลาเฉลี่ยเป็นระยะ ๆ (เช่นการลอยตัวในระยะยาว) ใน Y โมเดลนี้สามารถใช้เป็นแบบจำลองการถดถอยแบบไม่มีการสกัดกั้นซึ่ง ความแตกต่างแรกของ Y คือตัวแปรอิสระ เนื่องจากมีเพียงความแตกต่างที่ไม่มีความแตกต่างกันและเป็นระยะคงที่จึงถูกจัดเป็นแบบ quotARIMA (0,1,0) ด้วย constant. quot แบบ random-walk-without - drift จะเป็น ARIMA (0.1, 0) โดยไม่มีค่าคงที่ ARIMA (1,1,0) differenced แบบจำลอง autoregressive ลำดับแรก: ถ้าข้อผิดพลาดของรูปแบบการเดินแบบสุ่มเป็น autocorrelated บางทีปัญหาสามารถแก้ไขได้โดยการเพิ่มหนึ่งล่าช้าของตัวแปรขึ้นอยู่กับสมการทำนาย - - ie โดยการถอยกลับความแตกต่างแรกของ Y บนตัวเองล้าหลังโดยระยะเวลาหนึ่ง นี่จะเป็นสมการทำนายต่อไปนี้: ซึ่งสามารถจัดเรียงใหม่ได้นี่คือแบบจำลองอัตถิภาวนิยมอันดับแรกที่มีลำดับความแตกต่างอย่างไม่มีเงื่อนไขและลำดับคงที่อย่างใดอย่างหนึ่ง แบบจำลอง ARIMA (1,1,0) ARIMA (0,1,1) โดยไม่มีการเรียบแบบ exponential เรียบง่ายอย่างสม่ำเสมอ: อีกวิธีหนึ่งสำหรับการแก้ไขข้อผิดพลาด autocorrelated ในแบบจำลองการเดินแบบสุ่มได้รับการแนะนำโดยใช้แบบเรียบง่าย จำได้ว่าในบางช่วงเวลาที่ไม่ต่อเนื่อง (เช่นคนที่แสดงความผันผวนที่มีเสียงดังรอบ ๆ ค่าเฉลี่ยที่เปลี่ยนแปลงไปอย่างช้าๆ) รูปแบบการเดินแบบสุ่มไม่ทำงานและค่าเฉลี่ยที่เคลื่อนไหวอยู่ในอดีต กล่าวอีกนัยหนึ่งแทนที่จะใช้การสังเกตล่าสุดเป็นคาดการณ์การสังเกตครั้งต่อไปจะเป็นการดีกว่าที่จะใช้ค่าเฉลี่ยของข้อสังเกตสุดท้ายไม่กี่ข้อเพื่อกรองสัญญาณรบกวนและประมาณค่าเฉลี่ยของท้องถิ่นอย่างแม่นยำมากขึ้น แบบจำลองการทำให้เรียบแบบเรียบง่ายใช้ค่าเฉลี่ยเคลื่อนที่ที่ถ่วงน้ำหนักแบบพหุคูณของค่าที่ผ่านมาเพื่อให้ได้ผลลัพธ์นี้ สมการทำนายสำหรับแบบเรียบง่ายชี้แจงสามารถเขียนในรูปแบบที่เท่าเทียมทางคณิตศาสตร์ หนึ่งในนั้นคือแบบฟอร์ม 8220error correction8221 ที่เรียกว่า 8220error ซึ่งเป็นที่คาดการณ์ก่อนหน้านี้ได้รับการปรับเปลี่ยนไปในทิศทางของข้อผิดพลาดที่เกิดขึ้นเนื่องจาก e t-1 Y t-1 - 374 t-1 ตามนิยามนี้สามารถเขียนใหม่ได้ : ซึ่งเป็นสมการพยากรณ์ ARIMA (0,1,1) โดยไม่ใช้ค่าคงที่กับ 952 1 1 - 945 ซึ่งหมายความว่าคุณสามารถใส่ข้อมูลการเรียบง่ายที่ชี้แจงได้โดยระบุว่าเป็นแบบ ARIMA (0,1,1) โดยไม่มี ค่าคงที่และค่าสัมประสิทธิ์ของค่าสัมประสิทธิ์ (1) โดยประมาณเท่ากับ 1-alpha ในสูตร SES จำได้ว่าในรูปแบบ SES อายุโดยเฉลี่ยของข้อมูลในการคาดการณ์ล่วงหน้า 1 รอบคือ 1 945 หมายความว่าพวกเขาจะมีแนวโน้มที่จะล่าช้าหลังแนวโน้มหรือจุดหักเหตามระยะเวลาประมาณ 1 945 เป็นไปตามที่อายุโดยเฉลี่ยของข้อมูลในการคาดการณ์ล่วงหน้า 1 รอบของรูปแบบ ARIMA (0,1,1) - ไม่ใช้แบบคงที่คือ 1 (1 - 952 1) ดังนั้นตัวอย่างเช่นถ้า 952 1 0.8 อายุเฉลี่ยอยู่ที่ 5 เมื่อ 952 1 วิธีที่ 1 ค่า ARIMA (0,1,1) - โดยไม่คิดค่าคงที่จะกลายเป็นค่าเฉลี่ยเคลื่อนที่ในระยะยาวและเป็น 952 1 แนวทาง 0 มันกลายเป็นแบบสุ่มเดินโดยปราศจาก drift What8217s วิธีที่ดีที่สุดในการแก้ไข autocorrelation: การเพิ่ม AR terms หรือการเพิ่มเงื่อนไข MA ในสองโมเดลก่อนหน้าที่กล่าวข้างต้นปัญหาของความผิดพลาด autocorrelated ในแบบจำลองการเดินแบบสุ่มได้รับการแก้ไขในสองวิธีด้วยกันโดยการเพิ่มค่า lagged ของชุด differenced สมการหรือเพิ่มค่า lag ของข้อผิดพลาดในการคาดการณ์ แนวทางที่ดีที่สุดกฎของหัวแม่มือสำหรับสถานการณ์นี้ซึ่งจะมีการกล่าวถึงในรายละเอียดเพิ่มเติมในภายหลังว่าการเชื่อมโยงความสัมพันธ์ในทางบวกมักจะได้รับการปฏิบัติที่ดีที่สุดโดยการเพิ่มเทอม AR ไปยังโมเดลและการเชื่อมโยงกันในทางลบมักได้รับการปฏิบัติที่ดีที่สุดโดยการเพิ่ม ระยะ MA ในช่วงเวลาทางธุรกิจและเศรษฐกิจอัตลักษณ์เชิงลบมักเกิดขึ้นเป็นสิ่งประดิษฐ์ของความแตกต่าง (โดยทั่วไป differencing ลด autocorrelation บวกและอาจทำให้เกิดการเปลี่ยนจาก autocorrelation บวกกับลบ.) ดังนั้นรูปแบบ ARIMA (0,1,1) ซึ่ง differencing จะมาพร้อมกับระยะ MA จะใช้บ่อยกว่า ARIMA (1,1,0) รุ่น ARIMA (0,1,1) พร้อมกับการเรียบอย่างสม่ำเสมอด้วยการเพิ่มขึ้นอย่างรวดเร็ว: เมื่อใช้โมเดล SES เป็นแบบ ARIMA คุณจะได้รับความยืดหยุ่นบางอย่าง ประการแรกประเมินค่าสัมประสิทธิ์ของค่าสัมประสิทธิ์การใช้ไฟฟ้า (MA) (1) เป็นค่าลบ นี้สอดคล้องกับปัจจัยราบรื่นที่มีขนาดใหญ่กว่า 1 ในรูปแบบ SES ซึ่งโดยปกติจะไม่ได้รับอนุญาตตามขั้นตอนแบบ SES เหมาะสม ประการที่สองคุณมีตัวเลือกในการรวมระยะเวลาคงที่ในรูปแบบ ARIMA หากต้องการเพื่อประเมินแนวโน้มโดยเฉลี่ยที่ไม่ใช่ศูนย์ โมเดล ARIMA (0,1,1) มีค่าคงที่มีสมการทำนาย: การคาดการณ์ล่วงหน้าหนึ่งรอบจากแบบจำลองนี้มีคุณภาพคล้ายคลึงกับแบบจำลอง SES ยกเว้นว่าวิถีของการคาดการณ์ระยะยาวโดยทั่วไปคือ (ซึ่งมีความลาดชันเท่ากับ mu) มากกว่าเส้นแนวนอน ARIMA (0,2,1) หรือ (0,2,2) โดยไม่มีการเพิ่มความเรียบแบบเสียดสีเชิงเส้นแบบคงที่: โมเดลเรียบเรียงเชิงตัวเลขเป็นแบบเชิงเส้นเป็นแบบจำลอง ARIMA ซึ่งใช้ความแตกต่างกันตามคำต่าง ๆ สองแบบร่วมกับข้อกำหนดของ MA ความแตกต่างที่สองของซีรีส์ Y ไม่ใช่แค่ความแตกต่างระหว่าง Y กับตัวเองที่ล้าหลังไปสองช่วงคือความแตกต่างแรกของความแตกต่างแรกคือ การเปลี่ยนแปลงการเปลี่ยนแปลงของ Y ที่ระยะเวลา t ดังนั้นความแตกต่างที่สองของ Y ที่ระยะเวลา t เท่ากับ (Y t - Y t-1) - (Y t-1 - Y t-2) Y t-2Y t-1 Y t-2 ความแตกต่างที่สองของฟังก์ชันแบบไม่ต่อเนื่องมีลักษณะคล้ายคลึงกับอนุพันธ์ที่สองของฟังก์ชันต่อเนื่อง: วัดการอ้างอิงหรือ quotcurvaturequot ในฟังก์ชันตามจุดที่กำหนดในเวลา แบบจำลอง ARIMA (0,2,2) โดยไม่มีค่าคงที่คาดการณ์ว่าความแตกต่างที่สองของชุดเท่ากับฟังก์ชันเชิงเส้นของข้อผิดพลาดในการคาดการณ์สองข้อสุดท้าย: ซึ่งสามารถจัดเรียงใหม่ได้ว่า: ที่ 952 1 และ 952 2 เป็น MA (1) และ MA (2) ค่าสัมประสิทธิ์ นี่คือแบบจำลองการเพิ่มความเรียบแบบเชิงเส้นแบบทั่วไป เป็นหลักเช่นเดียวกับรุ่น Holt8217s และรุ่น Brown8217s เป็นกรณีพิเศษ ใช้ค่าเฉลี่ยเคลื่อนที่แบบถ่วงน้ำหนักแบบทวีคูณเพื่อประมาณทั้งระดับท้องถิ่นและแนวโน้มท้องถิ่นในชุด การคาดการณ์ในระยะยาวจากรุ่นนี้มาบรรจบกันเป็นเส้นตรงซึ่งความลาดชันขึ้นอยู่กับแนวโน้มโดยเฉลี่ยที่สังเกตได้จากช่วงปลายชุด ARIMA (1,1,2) โดยไม่ทำให้เกิดความเรียบแบบเสียดสีเชิงเส้นแบบลดแรงเสียดทาน โมเดลนี้แสดงในภาพนิ่งที่มาพร้อมกับรุ่น ARIMA คาดการณ์แนวโน้มในท้องถิ่นในตอนท้ายของซีรี่ส์ แต่แผ่ออกไปในขอบเขตที่คาดการณ์อีกต่อไปเพื่อนำเสนอข้อความเกี่ยวกับอนุรักษนิยมซึ่งเป็นแนวปฏิบัติที่ได้รับการสนับสนุนเชิงประจักษ์ ดูบทความเกี่ยวกับสาเหตุที่ทำไมผลงาน Trend ที่มีการกระแทกโดย Gardner and McKenzie และบทความ quotGolden Rulequot โดย Armstrong et al. สำหรับรายละเอียด เป็นที่แนะนำโดยทั่วไปให้ยึดติดกับโมเดลซึ่งอย่างน้อยหนึ่ง p และ q ไม่ใหญ่กว่า 1 คือไม่พยายามให้พอดีกับรูปแบบเช่น ARIMA (2,1,2) เนื่องจากมีแนวโน้มที่จะนำไปสู่การ overfitting และปัญหา quotcommon-factorquot ที่กล่าวถึงในรายละเอียดเพิ่มเติมในบันทึกย่อเกี่ยวกับโครงสร้างทางคณิตศาสตร์ของโมเดล ARIMA การใช้งานสเปรดชีต: โมเดล ARIMA เช่นที่อธิบายข้างต้นใช้งานง่ายในสเปรดชีต สมการทำนายเป็นเพียงสมการเชิงเส้นที่อ้างถึงค่าที่ผ่านมาของซีรีส์เวลาเดิมและค่าที่ผ่านมาของข้อผิดพลาด ดังนั้นคุณสามารถตั้งค่าสเปรดชีตการพยากรณ์ ARIMA ได้โดยจัดเก็บข้อมูลในคอลัมน์ A สูตรพยากรณ์ในคอลัมน์ B และข้อผิดพลาด (ข้อมูลลบการคาดการณ์) ในคอลัมน์ C สูตรการคาดการณ์ในเซลล์ทั่วไปในคอลัมน์ B จะเป็นเพียง นิพจน์เชิงเส้นที่อ้างถึงค่าในแถวก่อนหน้าของคอลัมน์ A และ C คูณด้วยค่าสัมประสิทธิ์ของ AR หรือ MA ที่เหมาะสมซึ่งเก็บไว้ในเซลล์ที่อื่นในสเปรดชีต RIMA ย่อมาจากโมเดลการเคลื่อนที่แบบรวมอัตโนมัติแบบอัตถดถอย (single vector) ARIMA เป็นเทคนิคการพยากรณ์ที่คาดการณ์มูลค่าในอนาคตของชุดข้อมูลโดยอิงกับความเฉื่อยของตัวเอง การประยุกต์ใช้หลักของมันอยู่ในพื้นที่ของการคาดการณ์ในระยะสั้นที่ต้องใช้จุดข้อมูลทางประวัติศาสตร์อย่างน้อย 40 จุด ทำงานได้ดีที่สุดเมื่อข้อมูลของคุณมีรูปแบบที่มั่นคงหรือสอดคล้องกันตลอดเวลาโดยมีจำนวนข้อผิดพลาดน้อยที่สุด บางครั้งเรียกว่า Box-Jenkins (หลังจากผู้เขียนต้นฉบับ) ARIMA มักจะดีกว่าเทคนิคการทำให้เกิดการชี้แจงเมื่อข้อมูลมีความยาวและความสัมพันธ์ระหว่างการสังเกตในอดีตมีเสถียรภาพ หากข้อมูลสั้นหรือมีความผันผวนสูงวิธีการปรับความเรียบบางวิธีอาจทำงานได้ดีขึ้น หากคุณไม่มีจุดข้อมูลอย่างน้อย 38 จุดคุณควรพิจารณาวิธีการอื่นนอกเหนือจาก ARIMA ขั้นตอนแรกในการใช้วิธีการ ARIMA คือการตรวจสอบ stationarity Stationarity แสดงให้เห็นว่าซีรีย์ยังคงอยู่ในระดับที่คงที่ตลอดเวลา หากมีแนวโน้มเช่นเดียวกับในแอปพลิเคชันทางเศรษฐกิจหรือธุรกิจส่วนใหญ่ข้อมูลของคุณจะยังคงอยู่ไม่หยุดนิ่ง ข้อมูลควรแสดงความแปรปรวนของความผันผวนตลอดเวลา นี่ดูได้อย่างง่ายดายด้วยชุดที่มีฤดูกาลมากและเติบโตขึ้นในอัตราที่รวดเร็วขึ้น ในกรณีเช่นนี้การขึ้นและการดาวน์ในฤดูกาลจะทวีความรุนแรงมากขึ้นเมื่อเวลาผ่านไป หากไม่พบเงื่อนไขการหยุดนิ่งเหล่านี้จะไม่สามารถคำนวณการคำนวณจำนวนมากที่เกี่ยวข้องกับกระบวนการนี้ได้ หากพล็อตข้อมูลแบบกราฟิกแสดงถึงความไม่เสถียรภาพคุณควรแตกต่างจากชุดข้อมูล Differencing เป็นวิธีที่ยอดเยี่ยมในการเปลี่ยนชุดแบบไม่ต่อเนื่องให้เป็นแบบคงที่ โดยการลบคำสังเกตในช่วงเวลาปัจจุบันออกจากข้อสังเกตก่อนหน้านี้ หากการแปลงนี้ทำเพียงครั้งเดียวกับชุดคุณจะกล่าวว่าข้อมูลนี้มีความแตกต่างกันเป็นครั้งแรก ขั้นตอนนี้เป็นหลักช่วยลดแนวโน้มหากชุดของคุณมีอัตราการเติบโตที่ค่อนข้างคงที่ หากอัตราการเติบโตเพิ่มขึ้นคุณสามารถใช้ขั้นตอนเดียวกันและทำให้ข้อมูลแตกต่างกันได้อีก จากนั้นข้อมูลของคุณจะแตกต่างกันไป Autocorrelations เป็นค่าตัวเลขที่ระบุว่าชุดข้อมูลเกี่ยวข้องกับตัวเองอย่างไรเมื่อเวลาผ่านไป อย่างแม่นยำมากขึ้นจะวัดว่าค่าข้อมูลอย่างมากที่ช่วงระยะเวลาที่ระบุเป็นจำนวนเท่าใดมีความสัมพันธ์กันเมื่อเวลาผ่านไป จำนวนรอบระยะเวลาโดยปกติจะเรียกว่าความล่าช้า ตัวอย่างเช่นค่าความสัมพันธ์ระหว่างความคลาดเคลื่อน 1 วัดค่าที่แตกต่างกันของช่วงเวลา 1 ช่วงเวลาที่มีความสัมพันธ์กันในชุดข้อมูล ความสัมพันธ์กันที่ความล่าช้า 2 วัดว่าข้อมูลสองช่วงเวลามีความสัมพันธ์กันอย่างไรในซีรี่ส์ Autocorrelations อาจอยู่ในช่วงตั้งแต่ 1 ถึง -1 ค่าใกล้เคียงกับ 1 แสดงถึงความสัมพันธ์ทางบวกที่สูงในขณะที่ค่าใกล้เคียงกับ -1 แสดงถึงความสัมพันธ์เชิงลบสูง มาตรการเหล่านี้มักได้รับการประเมินผ่านทางกราฟฟิกที่เรียกว่า correlagrams correlagram แปลงค่าความสัมพันธ์แบบอัตโนมัติสำหรับชุดข้อมูลหนึ่ง ๆ ที่มีความล่าช้าแตกต่างกัน นี่เรียกว่าฟังก์ชัน autocorrelation และมีความสำคัญมากในวิธีการ ARIMA วิธีการ ARIMA พยายามที่จะอธิบายการเคลื่อนไหวในชุดเวลาแบบคงที่ในฐานะที่เป็นหน้าที่ของสิ่งที่เรียกว่าพารามิเตอร์อัตถิภาวนิยมและค่าเฉลี่ยเคลื่อนที่ พารามิเตอร์เหล่านี้เรียกว่าพารามิเตอร์ AR (autoregessive) และพารามิเตอร์ MA (ค่าเฉลี่ยเคลื่อนที่) อาจมีการเขียนแบบ AR ที่มีเพียง 1 พารามิเตอร์เท่านั้น X (t) A (1) X (t-1) E (t) โดยที่ X (t) เวลาชุดภายใต้การตรวจสอบ A (1) พารามิเตอร์ autoregressive ของลำดับ 1 X (t-1) ชุดเวลาล้าหลัง 1 ระยะเวลา E (t) ความผิดพลาดของรูปแบบนี้ก็หมายความว่าค่าใดก็ตาม X (t) สามารถอธิบายได้จากฟังก์ชันของค่าก่อนหน้าที่ X (t-1) รวมทั้งข้อผิดพลาดแบบสุ่มบางส่วนที่ไม่สามารถอธิบายได้ E (t) ถ้าค่าประมาณของ A (1) เท่ากับ. 30 มูลค่าปัจจุบันของชุดจะสัมพันธ์กับ 30 ค่าก่อนหน้า 1 แน่นอนว่าซีรีย์นี้อาจเกี่ยวข้องกับมากกว่าหนึ่งค่าที่ผ่านมา ตัวอย่างเช่น X (t) A (1) X (t-1) A (2) X (t-2) E (t) นี่แสดงว่าค่าปัจจุบันของชุดคือการรวมกันของสองค่าก่อนหน้านี้ทันที, X (t-1) และ X (t-2) รวมทั้งข้อผิดพลาดแบบสุ่ม E (t) แบบจำลองของเราตอนนี้เป็นโมเดลอัตรกรรรณ์ของคำสั่ง 2 การเคลื่อนที่แบบเฉลี่ย: แบบที่สองของแบบจำลอง Box-Jenkins เรียกว่าแบบจำลองค่าเฉลี่ยเคลื่อนที่ แม้ว่ารูปแบบเหล่านี้มีลักษณะคล้ายกับรุ่น AR แต่แนวคิดที่อยู่เบื้องหลังพวกเขามีความแตกต่างกันออกไป การย้ายค่าเฉลี่ยจะสัมพันธ์กับสิ่งที่เกิดขึ้นในช่วง t เฉพาะกับข้อผิดพลาดแบบสุ่มที่เกิดขึ้นในช่วงเวลาที่ผ่านมาเช่น E (t-1), E (t-2) เป็นต้นแทนที่จะเป็น X (t-1), X ( t-2), (Xt-3) ตามแนวทาง autoregressive แบบเฉลี่ยถ่วงน้ำหนักโดยเฉลี่ยที่มีระยะ MA สามารถเขียนได้ดังนี้ X (t) - B (1) E (t-1) E (t) คําวา B (1) เรียกวา MA ของคําสั่ง 1. เครื่องหมายลบที่ดานหนาของพารามิเตอรใชสําหรับการประชุมเทานั้น ออกโดยอัตโนมัติโดยโปรแกรมคอมพิวเตอร์ส่วนใหญ่ แบบจำลองข้างต้นกล่าวง่ายๆว่าค่าที่กำหนดของ X (t) มีความสัมพันธ์โดยตรงกับความผิดพลาดแบบสุ่มในช่วงก่อนหน้า, E (t-1) และระยะเวลาข้อผิดพลาดปัจจุบัน E (t) เช่นเดียวกับในกรณีของโมเดลอัตถิภาวนิยมโมเดลค่าเฉลี่ยเคลื่อนที่สามารถขยายไปยังโครงสร้างคำสั่งซื้อที่สูงขึ้นซึ่งครอบคลุมชุดค่าผสมต่างๆและความยาวเฉลี่ยที่เคลื่อนที่ได้ วิธีการ ARIMA ยังช่วยให้สามารถสร้างโมเดลที่มีทั้งค่าเฉลี่ยอัตรวจและเคลื่อนไหวโดยรวมเข้าด้วยกัน โมเดลเหล่านี้มักเรียกว่าแบบผสม แม้ว่าสิ่งนี้จะทำให้เครื่องมือคาดการณ์ที่ซับซ้อนมากขึ้น แต่โครงสร้างอาจจำลองชุดข้อมูลได้ดีขึ้นและสร้างการคาดการณ์ที่แม่นยำขึ้น โมเดล Pure หมายความว่าโครงสร้างประกอบด้วยเฉพาะ AR หรือพารามิเตอร์ MA - ไม่ใช่ทั้งสองอย่าง โมเดลที่พัฒนาโดยวิธีนี้มักเรียกว่า ARIMA เนื่องจากใช้การผสมผสานของอัตมโนทัศน์ (AR), การผสมผสาน (I) - หมายถึงกระบวนการย้อนกลับของ differencing เพื่อสร้างการคาดการณ์และการดำเนินงานโดยเฉลี่ย (MA) แบบ ARIMA มักถูกระบุว่าเป็น ARIMA (p, d, q) นี่แสดงลำดับของคอมโพเนนต์ autoregressive (p) จำนวน operator ที่ต่างกัน (d) และคำสั่งที่สูงที่สุดของค่าเฉลี่ยเคลื่อนที่ ยกตัวอย่างเช่น ARIMA (2,1,1) หมายความว่าคุณมีแบบจำลองอัตถดถอยอันดับที่สองที่มีส่วนประกอบของค่าเฉลี่ยเคลื่อนที่อันดับแรกที่มีการจัดลำดับชุดหนึ่งครั้งเพื่อกระตุ้นให้เกิดการหยุดนิ่ง การเลือกข้อมูลจำเพาะที่ถูกต้อง: ปัญหาหลักในคลาสสิก Box-Jenkins กำลังพยายามตัดสินใจว่าจะใช้ ARIA ข้อกำหนดใดบ้างเพื่อใช้ - i. e. จำนวนอาร์เรย์และพารามิเตอร์ MA ที่รวมไว้ นี่คือสิ่งที่มากของ Box-Jenkings 1976 ได้ทุ่มเทให้กับกระบวนการระบุตัวตน ขึ้นอยู่กับการประเมินผลแบบกราฟิกและตัวเลขของการเชื่อมโยงความสัมพันธ์ระหว่างตัวอย่างและฟังก์ชันการเชื่อมโยงบางส่วน (autocorrelation) ดีสำหรับรุ่นพื้นฐานของคุณงานไม่ยากเกินไป แต่ละฟังก์ชันมีความสัมพันธ์กันโดยอัตโนมัติซึ่งมีลักษณะบางอย่าง อย่างไรก็ตามเมื่อคุณขึ้นไปอย่างซับซ้อนรูปแบบจะไม่สามารถตรวจพบได้ง่าย เพื่อให้เรื่องยากขึ้นข้อมูลของคุณเป็นเพียงตัวอย่างของกระบวนการอ้างอิงเท่านั้น ซึ่งหมายความว่าข้อผิดพลาดในการสุ่มตัวอย่าง (ข้อผิดพลาดค่าผิดพลาดในการวัด ฯลฯ ) อาจบิดเบือนกระบวนการระบุตัวตนทางทฤษฎี นั่นคือเหตุผลที่การสร้างแบบจำลอง ARIMA แบบดั้งเดิมเป็นศิลปะมากกว่าวิทยาศาสตร์ขั้นที่ 9: โมเดลเฉลี่ยเคลื่อนที่แบบอัตถดถอยโดย Svetlozar T. Rachev, Frank J. Fabozzi, Markus Hoechstoetter, Sergio M. Focardi, Bala G. Arshanapalli แบบจำลองการเคลื่อนที่แบบอัตถิภาวนิยม อ่านบทนี้คุณจะเข้าใจแนวคิดของการอัตถดถอยและโมเดลอัตถิภาวนิยม วิธีระบุโมเดลอัตถิภาวนิยม แนวคิดเรื่องการเคลื่อนย้ายค่าเฉลี่ยและแบบจำลองเฉลี่ยเคลื่อนที่ วิธีระบุรูปแบบเฉลี่ยเคลื่อนที่ วิธีการจำลองโมเดลเฉลี่ยเคลื่อนที่แบบอัตถิภาวนิยม (ARMA) วิธีการใช้เกณฑ์ข้อมูลสำหรับการเลือกแบบ ARMA วิธีการใช้ ARMA ในการสร้างแบบจำลองผลตอบแทนของหุ้น วิธีการใช้โมเดลอัตถดถอยโมเดลการเคลื่อนที่เฉลี่ยและแบบจำลอง ARMA เพื่อคาดการณ์ผลตอบแทนของหุ้นและวิธีประเมินประสิทธิภาพการคาดการณ์ของโมเดลเหล่านี้ แนวคิดของการเกิดการตอบสนองของเวกเตอร์ ในบทที่ 5 เราได้นำเสนอการวิเคราะห์อนุกรมเวลาที่ตัวแปรมีการเปลี่ยนแปลงตลอดเวลา ตามที่ได้กล่าวไว้ในบทนี้รากฐานของแบบจำลองชุดเวลาอิงตามสมมติฐานว่าคำรบกวนเป็นกระบวนการเสียงสีขาว ความหมายของข้อสันนิษฐานนี้ก็คือระยะเวลาที่เกิดวุ่นวายไม่สามารถใช้ในการพยากรณ์ความวุ่นวายในปัจจุบันและระยะเวลาการรบกวนมีความแปรปรวนคงที่ กล่าวอีกนัยหนึ่งสมมติฐานของสมมติฐานนี้คือการไม่มีความสัมพันธ์แบบอนุกรม (หรือความสามารถในการคาดการณ์) และการแปรปรวนร่วม (หรือความแปรปรวนคงที่ตามเงื่อนไข) อย่างไรก็ตามในการใช้งานเชิงประจักษ์ข้อสันนิษฐานทางเสียงสีขาวมักถูกละเมิด นั่นคือการสังเกตการณ์ต่อเนื่องแสดงการพึ่งพาแบบอนุกรม ภายใต้สถานการณ์เช่นนี้เครื่องมือคาดการณ์เช่นการเพิ่มประสิทธิภาพแบบเลขแจงที่ 1 อาจไม่ได้ผลและบางครั้งไม่เหมาะสมเนื่องจาก Safari ช่วยให้คุณเรียนรู้วิธีที่ดีที่สุด เข้าถึงวิดีโอได้ไม่ จำกัด การฝึกอบรมออนไลน์แบบสดๆเส้นทางการเรียนรู้หนังสือบทแนะนำแบบโต้ตอบและอื่น ๆ ไม่ต้องใช้บัตรเครดิต
No comments:
Post a Comment