ปริมาณ ซื้อขาย กลยุทธ์ ใน r ไฟล์ pdf
คณิตศาสตร์และการสร้างแบบจำลองทางการเงิน II (FINC 621) เป็นระดับบัณฑิตศึกษาที่มีให้ในปัจจุบันที่ Loyola University ในชิคาโกในช่วงฤดูหนาว FINC 621 สำรวจหัวข้อในด้านการเงินเชิงปริมาณคณิตศาสตร์และการเขียนโปรแกรม ชั้นเรียนมีลักษณะเป็นธรรมชาติและประกอบด้วยทั้งการบรรยายและส่วนประกอบของห้องปฏิบัติการ ห้องปฏิบัติการใช้ภาษาการเขียนโปรแกรม R และนักเรียนจะต้องส่งงานแต่ละครั้งในตอนท้ายของแต่ละชั้น เป้าหมายสุดท้ายของ FINC 621 คือการจัดหาเครื่องมือในทางปฏิบัติให้กับนักเรียนเพื่อใช้ในการสร้างแบบจำลองและวิเคราะห์กลยุทธ์การซื้อขายแบบง่ายๆ ลิงก์ที่มีประโยชน์บางอย่างเกี่ยวกับผู้สอน Harry G. เป็นผู้ค้าเชิงปริมาณอาวุโสสำหรับ บริษัท การค้า HFT ในเมืองชิคาโก เขาจบการศึกษาระดับปริญญาโทด้านวิศวกรรมไฟฟ้าและปริญญาโทด้านคณิตศาสตร์ทางการเงินจากมหาวิทยาลัยชิคาโก (master8217s) ในเวลาว่างแฮร์รี่สอนหลักสูตรระดับบัณฑิตศึกษาสาขาการเงินเชิงปริมาณที่ Loyola University ในชิคาโก เขายังเป็นนักเขียนเชิงปริมาณการค้ากับ R. คู่มือการเริ่มต้นของการค้าเชิงปริมาณในบทความนี้ Im จะแนะนำคุณกับแนวคิดพื้นฐานบางอย่างที่มาพร้อมกับระบบการซื้อขายเชิงปริมาณแบบ end-to-end โพสต์นี้หวังว่าจะให้บริการแก่ผู้ชมสองคน คนแรกจะเป็นบุคคลที่พยายามหางานทำที่กองทุนรวมในฐานะพ่อค้าเชิงปริมาณ ประการที่สองคือบุคคลที่ต้องการจะลองจัดตั้งธุรกิจการค้าปลีกของตนเองขึ้น การค้าเชิงปริมาณเป็นพื้นที่ที่มีความซับซ้อนมากของการเงินในเชิงปริมาณ อาจใช้เวลาเป็นจำนวนมากเพื่อให้ได้ความรู้ที่จำเป็นในการสัมภาษณ์หรือสร้างกลยุทธ์การซื้อขายของคุณเอง ไม่เพียง แต่ต้องใช้ความชำนาญด้านการเขียนโปรแกรมมากมายอย่างน้อยที่สุดในภาษาเช่น MATLAB, R หรือ Python อย่างไรก็ตามเมื่ออัตราการค้าของกลยุทธ์เพิ่มขึ้นด้านเทคโนโลยีกลายเป็นสิ่งที่เกี่ยวข้องมากขึ้น ดังนั้นการทำความคุ้นเคยกับ CC จะมีความสำคัญยิ่ง ระบบการซื้อขายเชิงปริมาณประกอบด้วยองค์ประกอบหลัก 4 ส่วน ได้แก่ การระบุกลยุทธ์การหากลยุทธ์การใช้ประโยชน์จากขอบและการตัดสินใจเกี่ยวกับความถี่ของการซื้อขายกลยุทธ์การทำย้อนหลังการได้รับข้อมูลการวิเคราะห์ประสิทธิภาพของกลยุทธ์และการลบความลำเอียงระบบการดำเนินการการเชื่อมโยงกับนายหน้าการซื้อขายอัตโนมัติและการลดราคา ค่าใช้จ่ายในการทำธุรกรรมการจัดการความเสี่ยง - การจัดสรรเงินทุนที่เหมาะสม, เกณฑ์การเดิมพันขนาดและจิตวิทยาการซื้อขายเริ่มต้นด้วยการดูวิธีการระบุกลยุทธ์การซื้อขาย การระบุกระบวนการเชิงกลยุทธ์กระบวนการซื้อขายเชิงปริมาณทั้งหมดเริ่มตั้งแต่ช่วงเริ่มต้นของการวิจัย กระบวนการวิจัยนี้ครอบคลุมถึงการค้นหากลยุทธ์โดยคำนึงถึงว่ากลยุทธ์นี้เหมาะสมกับกลยุทธ์อื่น ๆ ที่คุณอาจใช้หรือไม่ได้รับข้อมูลใด ๆ ที่จำเป็นในการทดสอบกลยุทธ์และพยายามเพิ่มประสิทธิภาพกลยุทธ์เพื่อสร้างผลตอบแทนที่สูงขึ้นและหรือลดความเสี่ยง คุณจำเป็นต้องคำนึงถึงความต้องการด้านเงินทุนของคุณเองหากใช้กลยุทธ์เป็นผู้ประกอบการค้าปลีกและค่าใช้จ่ายในการทำธุรกรรมจะส่งผลต่อกลยุทธ์อย่างไร ตรงกันข้ามกับความเชื่อที่เป็นที่นิยมนั้นเป็นเรื่องที่ค่อนข้างตรงไปตรงมาในการหากลยุทธ์ที่ทำกำไรได้จากแหล่งสาธารณะต่างๆ นักวิชาการมักเผยแพร่ผลการค้าเชิงทฤษฎี (แม้ว่าจะเป็นส่วนใหญ่ของค่าใช้จ่ายในการทำธุรกรรม) บล็อกการเงินเชิงปริมาณจะกล่าวถึงกลยุทธ์ในรายละเอียด วารสารการค้าจะร่างบางส่วนของกลยุทธ์ที่ใช้โดยกองทุน คุณอาจตั้งคำถามว่าเหตุใดบุคคลและ บริษัท จึงกระตือรือร้นที่จะหารือเกี่ยวกับกลยุทธ์ที่ทำกำไรได้โดยเฉพาะอย่างยิ่งเมื่อพวกเขารู้ว่าคนอื่น ๆ กำลังค้าขายอาจหยุดกลยุทธ์จากการทำงานในระยะยาว เหตุผลอยู่ในข้อเท็จจริงที่ว่าพวกเขาจะไม่ค่อยพูดถึงพารามิเตอร์ที่แน่นอนและวิธีการปรับแต่งที่พวกเขาได้ดำเนินการ การเพิ่มประสิทธิภาพเหล่านี้เป็นกุญแจสำคัญในการเปลี่ยนกลยุทธ์ที่ค่อนข้างปานกลางให้กลายเป็นกลยุทธ์ที่ทำกำไรได้มาก ในความเป็นจริงหนึ่งในวิธีที่ดีที่สุดในการสร้างกลยุทธ์เฉพาะของคุณเองคือการหาวิธีการที่คล้ายคลึงกันและดำเนินการตามขั้นตอนการเพิ่มประสิทธิภาพของคุณเอง นี่คือรายชื่อเล็ก ๆ ของสถานที่ที่จะเริ่มมองหาแนวคิดเชิงกลยุทธ์: หลายยุทธศาสตร์ที่คุณจะดูจะตกอยู่ในประเภทของการพลิกกลับหมายถึงและแนวโน้มต่อไปเรื่อย ๆ กลยุทธ์การคืนค่าเฉลี่ยคือการใช้ประโยชน์จากข้อเท็จจริงที่ว่าค่าเฉลี่ยระยะยาวในชุดราคา (เช่นการแพร่กระจายระหว่างสองสินทรัพย์ที่มีความสัมพันธ์) มีอยู่และความเบี่ยงเบนระยะสั้น ๆ จากค่าเฉลี่ยนี้จะเปลี่ยนกลับคืนมา กลยุทธ์ด้านโมเมนตัมพยายามใช้ประโยชน์จากทั้งด้านจิตวิทยาของนักลงทุนและโครงสร้างเงินทุนที่มีขนาดใหญ่โดยยึดตามแนวโน้มตลาดซึ่งสามารถรวบรวมแรงผลักดันไปในทิศทางเดียวและปฏิบัติตามแนวโน้มจนกว่าจะกลับรายการ อีกด้านที่สำคัญอย่างหนึ่งของการซื้อขายเชิงปริมาณคือความถี่ของกลยุทธ์การซื้อขาย การซื้อขายคลื่นความถี่ต่ำ (LFT) โดยทั่วไปหมายถึงกลยุทธ์ใด ๆ ที่มีทรัพย์สินเกินกว่าวันซื้อขาย ตามลําดับการซื้อขายความถี่สูง (HFT) โดยทั่วไปหมายถึงกลยุทธที่มีสินทรัพยระหวางวัน การค้าขายความถี่สูง (UHFT) หมายถึงกลยุทธ์ที่มีสินทรัพย์ตามลำดับวินาทีและมิลลิวินาที ในฐานะที่เป็นผู้ประกอบการค้าปลีก HFT และ UHFT เป็นไปได้อย่างแน่นอน แต่มีเฉพาะความรู้ด้านเทคโนโลยีการซื้อขายและการเปลี่ยนแปลงหนังสือสั่งซื้อเท่านั้น เราจะไม่พูดถึงประเด็นเหล่านี้ในบทความที่แนะนำในบทความนี้ เมื่อกลยุทธ์หรือชุดของกลยุทธ์ได้รับการระบุแล้วตอนนี้จำเป็นต้องได้รับการทดสอบเพื่อหาผลกำไรจากข้อมูลทางประวัติศาสตร์ นั่นคือโดเมนของ backtesting เป้าหมายของการทำ backtesting คือการแสดงหลักฐานว่ากลยุทธ์ที่ระบุผ่านกระบวนการข้างต้นเป็นประโยชน์เมื่อนำมาใช้กับข้อมูลทั้งในอดีตและนอกกลุ่มตัวอย่าง สิ่งนี้กำหนดความคาดหวังว่ายุทธศาสตร์จะดำเนินการอย่างไรในโลกแห่งความเป็นจริง อย่างไรก็ตามการทำ backtesting ไม่ใช่การรับประกันความสำเร็จด้วยเหตุผลหลายประการ อาจเป็นพื้นที่ที่ละเอียดที่สุดในการซื้อขายเชิงปริมาณเนื่องจากมีความลำเอียงจำนวนมากซึ่งต้องพิจารณาอย่างรอบคอบและกำจัดให้มากที่สุดเท่าที่จะเป็นไปได้ เราจะหารือเกี่ยวกับประเภททั่วไปของอคติรวมทั้งมองไปข้างหน้าอคติ (หรือที่เรียกว่า data-snooping bias) พื้นที่อื่น ๆ ที่มีความสำคัญภายใน backtesting รวมถึงความพร้อมใช้งานและความสะอาดของข้อมูลในอดีตรวมถึงค่าใช้จ่ายในการทำธุรกรรมจริงและการตัดสินใจบนแพลตฟอร์ม backtesting ที่มีประสิทธิภาพ ปรึกษาเรื่องต้นทุนการทำธุรกรรมในส่วนระบบการดำเนินการด้านล่างนี้ เมื่อมีการระบุกลยุทธ์แล้วจำเป็นต้องได้รับข้อมูลทางประวัติศาสตร์ที่จะทำการทดสอบและอาจปรับแต่ง มีผู้จัดจำหน่ายข้อมูลจำนวนมากในทุกหมวดสินทรัพย์ ค่าใช้จ่ายของพวกเขาโดยทั่วไปมีขนาดตามคุณภาพความลึกและตรงเวลาของข้อมูล จุดเริ่มต้นแบบดั้งเดิมสำหรับผู้ค้าปลีกรายเริ่มต้น (อย่างน้อยในระดับค้าปลีก) คือการใช้ชุดข้อมูลฟรีจาก Yahoo Finance ฉันจะไม่ค่อยอาศัยผู้ให้บริการมากเกินไปในที่นี้ แต่ฉันต้องการเน้นปัญหาทั่วไปเมื่อเกี่ยวข้องกับชุดข้อมูลทางประวัติศาสตร์ ความกังวลหลักเกี่ยวกับข้อมูลทางประวัติศาสตร์ ได้แก่ ความถูกต้องความถูกต้องความลำเอียงการรอดชีวิตและการปรับตัวสำหรับการกระทำขององค์กรเช่นการจ่ายเงินปันผลและการแบ่งหุ้น: ความถูกต้องเกี่ยวข้องกับคุณภาพโดยรวมของข้อมูล - ไม่ว่าจะมีข้อผิดพลาดใด ๆ ข้อผิดพลาดบางครั้งสามารถระบุได้ง่ายเช่นด้วยตัวกรองขัดขวาง ซึ่งจะคัดลอกข้อมูลที่ไม่ถูกต้องในข้อมูลชุดเวลาและแก้ไขให้ถูกต้อง ในเวลาอื่น ๆ พวกเขาอาจเป็นเรื่องยากที่จะจุด บ่อยครั้งที่จำเป็นต้องมีผู้ให้บริการตั้งแต่สองรายขึ้นไปและตรวจสอบข้อมูลทั้งหมดของตนต่อกันและกัน อคติการรอดชีวิตมักเป็นคุณลักษณะของชุดข้อมูลฟรีหรือราคาถูก ชุดข้อมูลที่มีความลำเอียงรอดชีวิตหมายความว่าไม่มีข้อมูลที่ไม่มีการซื้อขายอีกต่อไป ในกรณีของหุ้นหมายถึงหุ้นที่ถูกเพิกถอนจากการเป็นหลักทรัพย์จดทะเบียน ความลำเอียงนี้หมายความว่ากลยุทธ์การซื้อขายหุ้นใด ๆ ที่ทดสอบบนชุดข้อมูลดังกล่าวน่าจะมีผลดีกว่าในโลกจริงเนื่องจากผู้ชนะในอดีตได้รับการคัดเลือกมาแล้ว การดำเนินธุรกิจของ บริษัท รวมถึงกิจกรรมด้านโลจิสติกส์ซึ่งดำเนินการโดย บริษัท ซึ่งมักจะทำให้เกิดการเปลี่ยนแปลงขั้นตอนในราคาวัตถุดิบซึ่งไม่ควรรวมอยู่ในการคำนวณผลตอบแทนของราคา การปรับเงินปันผลและการแยกสต็อกเป็นข้ออ้างที่พบบ่อย กระบวนการที่เรียกว่าการปรับหลังเป็นสิ่งจำเป็นที่จะต้องดำเนินการในแต่ละการกระทำเหล่านี้ เราต้องระมัดระวังอย่างมากที่จะไม่สับสนในการแยกหุ้นด้วยการปรับผลตอบแทนที่แท้จริง นักลงทุนจำนวนมากได้รับความสนใจจากการดำเนินการขององค์กรเพื่อที่จะปฏิบัติตามขั้นตอนการทำข้อสอบ backtest จำเป็นต้องใช้แพลตฟอร์มซอฟต์แวร์ คุณมีทางเลือกระหว่างซอฟต์แวร์ backtest โดยเฉพาะเช่น Tradestation, แพลตฟอร์มตัวเลขเช่น Excel หรือ MATLAB หรือการติดตั้งแบบกำหนดเองทั้งหมดในภาษาเขียนโปรแกรมเช่น Python หรือ C. ฉันจะไม่ค่อยมีที่อยู่ใน Tradestation (หรือคล้ายกัน), Excel หรือ MATLAB เนื่องจากฉันเชื่อมั่นในการสร้างสแต็คเทคโนโลยีภายในองค์กรแบบเต็มรูปแบบ (สำหรับเหตุผลด้านล่าง) หนึ่งในประโยชน์ของการทำเช่นนั้นก็คือซอฟต์แวร์ backtest และระบบการปฏิบัติงานสามารถผนวกรวมได้แม้จะมีกลยุทธ์ทางสถิติขั้นสูงมาก สำหรับกลยุทธ์ HFT โดยเฉพาะคุณจำเป็นต้องใช้การติดตั้งแบบกำหนดเอง เมื่อ backtesting ระบบหนึ่งจะต้องสามารถปริมาณวิธีการที่ดีที่มีประสิทธิภาพ เมตริกมาตรฐานอุตสาหกรรมสำหรับกลยุทธ์เชิงปริมาณคือการเบิกใช้สูงสุดและอัตราส่วน Sharpe การเบิกจ่ายสูงสุดจะทำให้เกิดการลดลงสูงสุดในช่วงเส้นโค้งของบัญชีในช่วงเวลาหนึ่ง ๆ (โดยปกติเป็นประจำทุกปี) ค่านี้มักถูกอ้างถึงเป็นเปอร์เซ็นต์ กลยุทธ์ LFT มีแนวโน้มที่จะมีการเบี่ยงเบนมากกว่ากลยุทธ์ HFT เนื่องจากปัจจัยทางสถิติจำนวนมาก ผลการทดสอบย้อนหลังในอดีตจะแสดงการเบิกใช้สูงสุดที่ผ่านมาซึ่งเป็นแนวทางที่ดีสำหรับการลดประสิทธิภาพในอนาคตของกลยุทธ์ การวัดที่สองคืออัตราส่วน Sharpe ซึ่งเป็นค่าเฉลี่ยของผลตอบแทนส่วนเกินที่หารด้วยส่วนเบี่ยงเบนมาตรฐานของผลตอบแทนส่วนเกินเหล่านั้น ที่นี่ผลตอบแทนส่วนเกินหมายถึงการกลับมาของกลยุทธ์เหนือเกณฑ์ที่กำหนดไว้ล่วงหน้า เช่น SP500 หรือตั๋วเงินคลัง 3 เดือน โปรดทราบว่าผลตอบแทนรายปีไม่ใช่มาตรการที่มักใช้เนื่องจากไม่คำนึงถึงความผันผวนของกลยุทธ์ (ซึ่งแตกต่างจากอัตราส่วน Sharpe) เมื่อกลยุทธ์ได้รับการ backtested และถือว่าเป็นอิสระจากความลำเอียง (ในเท่าที่เป็นไปได้) กับชาร์ปที่ดีและ drawdowns ลดลงก็เป็นเวลาที่จะสร้างระบบการดำเนินการ ระบบการดำเนินการ (Execution Systems) ระบบการดำเนินงานคือวิธีการที่รายการซื้อขายที่เกิดจากกลยุทธ์จะถูกส่งและดำเนินการโดยโบรกเกอร์ แม้จะมีการสร้างการค้าแบบกึ่งอัตโนมัติหรือแม้แต่แบบอัตโนมัติก็ตามกลไกการเรียกใช้งานอาจเป็นแบบคู่มือกึ่งมือ (เช่นคลิกเดียว) หรือแบบอัตโนมัติทั้งหมด สำหรับกลยุทธ์ LFT เทคนิคคู่มือและกึ่งคู่มือเป็นเรื่องปกติ สำหรับกลยุทธ์ HFT มีความจำเป็นต้องสร้างกลไกการดำเนินการโดยอัตโนมัติแบบเต็มรูปแบบซึ่งมักจะเป็นคู่ขนานกับเครื่องกำเนิดการค้า (เนื่องจากการพึ่งพาซึ่งกันและกันของกลยุทธ์และเทคโนโลยี) ข้อควรพิจารณาที่สำคัญในการสร้างระบบการดำเนินการคือส่วนติดต่อกับนายหน้าซื้อขายหลักทรัพย์ การลดค่าใช้จ่ายในการทำธุรกรรม (รวมถึงค่าคอมมิชชั่นการลื่นไถลและการแพร่กระจาย) และความแตกต่างของประสิทธิภาพของระบบออนไลน์จากผลการดำเนินงานที่ได้รับการสนับสนุน มีหลายวิธีในการติดต่อกับนายหน้าซื้อขายหลักทรัพย์ ตั้งแต่การโทรหาโบรกเกอร์ของคุณทางโทรศัพท์ไปจนถึง Application Programming Interface (API) ที่มีประสิทธิภาพสูงโดยอัตโนมัติ คุณต้องการทำให้ธุรกรรมการค้าของคุณดำเนินไปโดยเร็วที่สุดเท่าที่จะเป็นไปได้ ช่วยให้คุณสามารถเรียกใช้กลยุทธ์หรือแม้แต่กลยุทธ์ของความถี่สูง (ในความเป็นจริง HFT เป็นไปไม่ได้อย่างยิ่งโดยไม่ต้องดำเนินการโดยอัตโนมัติ) ซอฟต์แวร์ backtesting ที่กล่าวถึงข้างต้นเช่น MATLAB, Excel และ Tradestation เหมาะสำหรับการใช้ความถี่ต่ำและกลยุทธ์ที่ง่ายกว่า อย่างไรก็ตามจำเป็นที่จะต้องสร้างระบบการดำเนินการภายในที่เขียนด้วยภาษาที่มีประสิทธิภาพสูงเช่น C เพื่อทำ HFT จริง เป็นเรื่องเล็ก ๆ น้อย ๆ ในกองทุนที่ผมเคยทำงานมาเรามีวงเงินการซื้อขาย 10 นาทีโดยที่เราจะดาวน์โหลดข้อมูลตลาดใหม่ ๆ ทุกๆ 10 นาทีจากนั้นจะดำเนินการซื้อขายตามข้อมูลดังกล่าวในกรอบเวลาเดียวกัน นี่เป็นการใช้สคริปต์ Python ที่เพิ่มประสิทธิภาพ สำหรับข้อมูลที่มีข้อมูลใกล้เคียงกับนาทีหรือสองความถี่ฉันเชื่อว่า CC น่าจะเหมาะกว่ามาก ในกองทุนที่มีขนาดใหญ่มักไม่ใช่โดเมนของผู้ประกอบการระบบควอนตัมเพื่อเพิ่มประสิทธิภาพการดำเนินงาน อย่างไรก็ตามในร้านค้าขนาดเล็กหรือ บริษัท HFT พ่อค้าเป็นผู้บริหารและดังนั้นทักษะที่กว้างมากมักเป็นที่น่าพอใจ จำไว้ว่าถ้าคุณต้องการที่จะจ้างโดยกองทุน ทักษะการเขียนโปรแกรมของคุณจะมีความสำคัญถ้าไม่มากไปกว่าสถิติและความสามารถทางเศรษฐมิติของคุณอีกประเด็นสำคัญที่อยู่ภายใต้แบนเนอร์ของการดำเนินการคือการลดต้นทุนการทำธุรกรรม ค่าคอมมิชชั่น (หรือภาษี) โดยทั่วไปมีอยู่ 3 ส่วนคือค่าธรรมเนียมที่เรียกเก็บจากนายหน้าซื้อขายหลักทรัพย์อัตราแลกเปลี่ยนและหน่วยงานกำกับดูแลของ SEC (หรือหน่วยงานกำกับดูแลของรัฐบาลที่คล้ายคลึงกัน) ซึ่งเป็นความแตกต่างระหว่างสิ่งที่คุณต้องการให้เป็น เต็มไปด้วยสิ่งที่มันเป็นจริงเต็มไปด้วยการแพร่กระจายซึ่งเป็นความแตกต่างระหว่างราคา bidask ของการรักษาความปลอดภัยที่มีการซื้อขาย โปรดทราบว่าการแพร่กระจายจะไม่คงที่และขึ้นอยู่กับสภาพคล่องในปัจจุบัน (เช่นความพร้อมในการสั่งซื้อ buysell) ในตลาด ค่าใช้จ่ายในการทำธุรกรรมสามารถสร้างความแตกต่างระหว่างกลยุทธ์ที่ทำกำไรได้มากกับอัตราส่วน Sharpe ที่ดีและเป็นกลยุทธ์ที่ไม่หวังผลกำไรมากด้วยอัตราส่วน Sharpe ที่แย่มาก อาจเป็นความท้าทายในการทำนายค่าใช้จ่ายในการทำธุรกรรมได้อย่างถูกต้องจากแบบทดสอบหลังการขาย ทั้งนี้ขึ้นอยู่กับความถี่ของกลยุทธ์คุณจะต้องเข้าถึงข้อมูลการแลกเปลี่ยนข้อมูลซึ่งจะรวมถึงข้อมูลการติเตียนสำหรับราคา bidask ทีมทั้งหมดของ quants จะทุ่มเทเพื่อเพิ่มประสิทธิภาพของการดำเนินการในกองทุนขนาดใหญ่ด้วยเหตุผลเหล่านี้ พิจารณาสถานการณ์ที่กองทุนต้องระงับการค้าจำนวนมาก (ซึ่งเหตุผลที่ต้องทำเช่นนั้นมีมากมายและแตกต่างกันไป) การทุ่มตลาดหุ้นจำนวนมากเข้าสู่ตลาดจะเป็นการกดดันราคาอย่างรวดเร็วและอาจไม่ได้รับการดำเนินการที่ดีที่สุด ดังนั้นขั้นตอนวิธีที่หยดฟีดคำสั่งเข้าสู่ตลาดอยู่แม้ว่ากองทุนจะเสี่ยงต่อการลื่นไถล นอกจากนั้นกลยุทธ์อื่น ๆ ยังเป็นประโยชน์ต่อความจำเป็นเหล่านี้และสามารถใช้ประโยชน์จากความไร้ประสิทธิภาพ นี่คือโดเมนของ arbitrage โครงสร้างของโครงสร้าง ประเด็นสำคัญที่สำคัญที่สุดสำหรับระบบการดำเนินการคือความแตกต่างของประสิทธิภาพของกลยุทธ์จากผลการดำเนินงานที่ได้รับการสนับสนุน นี้สามารถเกิดขึ้นได้จากหลายสาเหตุ ใดก็ตามเราได้กล่าวถึงอคติดูล่วงหน้าและการเพิ่มประสิทธิภาพอคติในเชิงลึกเมื่อพิจารณา backtests อย่างไรก็ตามกลยุทธ์บางอย่างไม่ได้ทำให้ง่ายต่อการทดสอบอคติเหล่านี้ก่อนที่จะมีการใช้งาน นี้เกิดขึ้นใน HFT ส่วนใหญ่ อาจมีข้อผิดพลาดในระบบการดำเนินการรวมถึงกลยุทธ์การซื้อขายที่ไม่ปรากฏในแบบทดสอบหลังการขาย แต่แสดงในการซื้อขายสด ตลาดอาจได้รับการเปลี่ยนแปลงระบอบการปกครองหลังจากการปรับใช้กลยุทธ์ของคุณ สภาพแวดล้อมด้านการกำกับดูแลใหม่การเปลี่ยนแปลงความเชื่อมั่นของนักลงทุนและปรากฏการณ์ทางเศรษฐกิจมหภาคอาจนำไปสู่ความแตกต่างในด้านการตลาดและความสามารถในการทำกำไรของกลยุทธ์ของคุณ การจัดการความเสี่ยงชิ้นสุดท้ายของปริศนาการค้าเชิงปริมาณคือกระบวนการบริหารความเสี่ยง ความเสี่ยงรวมถึงอคติทั้งหมดที่กล่าวมาก่อนหน้านี้ ซึ่งจะรวมถึงความเสี่ยงด้านเทคโนโลยีเช่นเซิร์ฟเวอร์ที่อยู่ในที่ทำการแลกเปลี่ยนอย่างฉับพลันทำให้เกิดความผิดปกติของฮาร์ดดิสก์ ซึ่งรวมถึงความเสี่ยงในการเป็นนายหน้าซื้อขายหลักทรัพย์เช่นนายหน้าล้มละลาย (ไม่ใช่เรื่องที่บ้าคลั่งเนื่องจากเป็นเรื่องที่ทำให้กลัวกับ MF Global) ในระยะสั้นมันครอบคลุมเกือบทุกอย่างที่อาจจะรบกวนการดำเนินงานการค้าซึ่งมีหลายแหล่ง หนังสือทั้งเล่มมีไว้สำหรับการจัดการความเสี่ยงสำหรับกลยุทธ์เชิงปริมาณดังนั้นฉันจึงไม่พยายามทำความเข้าใจกับแหล่งความเสี่ยงที่เป็นไปได้ทั้งหมดที่นี่ การบริหารความเสี่ยงยังครอบคลุมถึงสิ่งที่เรียกว่าการจัดสรรทุนที่เหมาะสม ซึ่งเป็นสาขาของทฤษฎีพอร์ตโฟลิโอ นี่คือวิธีการจัดสรรทุนให้กับชุดของกลยุทธ์ที่แตกต่างกันและการค้าภายในกลยุทธ์เหล่านั้น เป็นพื้นที่ที่ซับซ้อนและใช้คณิตศาสตร์บางอย่างที่ไม่ใช่คณิตศาสตร์เล็กน้อย มาตรฐานอุตสาหกรรมที่การจัดสรรเงินทุนและการใช้ประโยชน์จากกลยุทธ์ที่เหมาะสมเกี่ยวข้องกับการนี้เรียกว่าเกณฑ์ Kelly ตั้งแต่นี้เป็นบทความเบื้องต้นผมไม่ได้อยู่ในการคำนวณของ เกณฑ์ของเคลลี่ทำให้สมมติฐานเกี่ยวกับลักษณะทางสถิติของผลตอบแทนซึ่งมักไม่ค่อยถือเป็นจริงในตลาดการเงินดังนั้นนักค้ามักจะระมัดระวังในการดำเนินการ อีกหนึ่งองค์ประกอบสำคัญของการบริหารความเสี่ยงคือการจัดการกับรายละเอียดทางจิตใจของตัวเอง มีอคติทางความคิดหลายอย่างที่สามารถเล็ดลอดเข้าสู่การซื้อขายได้ แม้ว่าจะเป็นปัญหาที่เกิดขึ้นกับการซื้อขายแบบอัลกอริทึมหากกลยุทธ์เหลือเพียงอย่างเดียวความอคติแบบทั่วไปคือการสูญเสียการสูญเสียที่ตำแหน่งที่สูญเสียจะไม่ถูกปิดออกเนื่องจากความเจ็บปวดที่ต้องตระหนักถึงความสูญเสีย ในทำนองเดียวกันผลกำไรสามารถทำได้เร็วเกินไปเพราะความกลัวในการสูญเสียกำไรที่ได้รับแล้วอาจจะมากเกินไป อีกประการหนึ่งที่เป็นที่รู้จักกันทั่วไปว่าเป็นความอคติใหม่ เรื่องนี้แสดงออกเมื่อผู้ค้าใส่ใจมากเกินไปในเหตุการณ์ล่าสุดและไม่ได้อยู่ในระยะยาว แล้วแน่นอนว่ามีคู่แบบคลาสสิกของอารมณ์อคติ - ความกลัวและความโลภ สิ่งเหล่านี้มักจะนำไปสู่การใช้ประโยชน์หรือทำให้เกิดการใช้ประโยชน์ได้มากเกินไปซึ่งอาจทำให้เกิดการระเบิด (ซึ่งเป็นส่วนของบัญชีที่มุ่งไปที่ศูนย์หรือแย่ลง) หรือลดผลกำไร ที่สามารถมองเห็นได้การซื้อขายเชิงปริมาณเป็นเรื่องที่ซับซ้อนมากและน่าสนใจมากในด้านการเงินเชิงปริมาณ ฉันมีรอยขีดข่วนแท้จริงของพื้นผิวของหัวข้อในบทความนี้และได้รับแล้วค่อนข้างยาวหนังสือและเอกสารทั้งหมดได้รับการเขียนเกี่ยวกับปัญหาที่ฉันได้รับเฉพาะประโยคหรือสองต่อ ด้วยเหตุผลดังกล่าวก่อนที่จะสมัครงานการจัดหาเงินทุนเป็นจำนวนมากจึงจำเป็นต้องมีการศึกษาขั้นพื้นฐานเป็นจำนวนมาก อย่างน้อยที่สุดคุณจะต้องมีภูมิหลังที่กว้างขวางในสถิติและเศรษฐมิติที่มีประสบการณ์มากในการใช้งานผ่านทางภาษาโปรแกรมเช่น MATLAB, Python หรือ R. สำหรับกลยุทธ์ที่ซับซ้อนมากขึ้นในตอนท้ายของความถี่ที่สูงขึ้นชุดทักษะของคุณอาจเป็นไปได้ รวมถึงการแก้ไขเคอร์เนลลินุกซ์, CC, การเขียนโปรแกรมประกอบและการเพิ่มประสิทธิภาพแฝงของเครือข่าย หากคุณสนใจในการพยายามสร้างกลยุทธ์การซื้อขายแบบอัลกอรึทึมของตัวเองข้อเสนอแนะแรกของฉันก็คือการทำให้การเขียนโปรแกรมเป็นไปอย่างดี การตั้งค่าของฉันคือการสร้างข้อมูล grabber, backtester กลยุทธ์และระบบการทำงานให้มากที่สุดเท่าที่จะเป็นไปได้ หากเงินทุนของคุณอยู่ในสายคุณจะไม่นอนหลับดีขึ้นในเวลากลางคืนโดยรู้ว่าคุณได้ทดสอบระบบของคุณอย่างครบถ้วนและตระหนักถึงข้อผิดพลาดและปัญหาเฉพาะของ Outsourcing นี้ไปยังผู้ขายในขณะที่อาจช่วยประหยัดเวลาในระยะสั้นอาจเป็นอย่างมาก แพงในระยะยาว เพียงแค่เริ่มต้นกับการค้าเชิงปริมาณ 30 พฤศจิกายน 2016, 12:34 น. ไม่กี่เดือนที่ผ่านมาผู้อ่านชี้ให้ฉันเห็นวิธีการใหม่ในการเชื่อมต่อ R และ Excel ฉัน don8217t รู้นานเท่าไหร่นี้ได้รับรอบ แต่ฉันไม่เคยเจอมันและ I8217ve ไม่เคยเห็นโพสต์บล็อกหรือบทความเกี่ยวกับเรื่องใด ๆ ดังนั้นฉันจึงตัดสินใจที่จะเขียนโพสต์เป็นเครื่องมือที่มีค่าจริงๆและก่อนใครถาม I8217m ไม่เกี่ยวข้องกับ บริษัท ในทางใดทางหนึ่ง BERT ย่อมาจาก Basic Excel R Toolkit It8217s ฟรี (มีใบอนุญาตภายใต้ GPL v2) และได้รับการพัฒนาโดย Structured Data LLC ในขณะที่เขียนเวอร์ชันปัจจุบันของ BERT เท่ากับ 1.07 ข้อมูลเพิ่มเติมสามารถดูได้ที่นี่. จากมุมมองด้านเทคนิคเพิ่มเติม BERT ได้รับการออกแบบมาเพื่อสนับสนุนการทำงานของ R จากเซลล์กระดาษคำนวณของ Excel ในข้อกำหนดของ Excel, it8217s สำหรับการเขียน User-Defined Functions (UDF) ใน R. ใน I8217m โพสต์นี้จะไม่แสดงให้คุณเห็นว่า R และ Excel มีปฏิสัมพันธ์ผ่านทาง BERT มีบทเรียนดีๆอยู่ที่นี่ ที่นี่และที่นี่ แต่ฉันต้องการแสดงให้คุณเห็นว่าฉันใช้ BERT เพื่อสร้าง 8220control tower8221 เพื่อการซื้อขายของฉันอย่างไร สัญญาณการค้าของฉันถูกสร้างโดยใช้รายการยาวของไฟล์ R แต่ฉันต้องการความยืดหยุ่นของ Excel เพื่อแสดงผลลัพธ์อย่างรวดเร็วและมีประสิทธิภาพ ดังที่แสดงไว้ข้างต้น BERT สามารถทำได้สำหรับฉัน แต่ฉันต้องการปรับแต่งแอพพลิเคชันให้ตรงกับความต้องการของฉันด้วย โดยการรวมพลังของ XML, VBA, R และ BERT ฉันสามารถสร้างแอปพลิเคชันที่ดูดี แต่ทรงพลังในรูปแบบไฟล์ Excel ที่มีรหัส VBA ต่ำสุด สุดท้ายฉันมีไฟล์ Excel เดียวรวบรวมงานทั้งหมดที่จำเป็นในการจัดการพอร์ตโฟลิโอของฉัน: การอัพเดตฐานข้อมูลการสร้างสัญญาณการส่งใบสั่งซื้อเป็นต้น 8230 วิธีการของฉันอาจถูกแบ่งออกเป็น 3 ขั้นตอนด้านล่างนี้: ใช้ XML เพื่อสร้างเมนูและปุ่มที่ผู้ใช้กำหนดไว้ใน Excel ไฟล์. เมนูและปุ่มข้างต้นเป็นหลักเรียกฟังก์ชัน VBA ฟังก์ชั่น VBA ดังกล่าวจะถูกตัดรอบฟังก์ชัน R ที่กำหนดโดยใช้ BERT ด้วยวิธีนี้ฉันสามารถเก็บความแตกต่างระหว่างหลักของรหัสของฉันเก็บไว้ใน R, SQL และ Python และทุกอย่างใช้ในการแสดงและจัดรูปแบบผลเก็บไว้ใน Excel, VBA amp XML ในส่วนถัดไปฉันจะนำเสนอสิ่งที่จำเป็นสำหรับการพัฒนาแนวทางดังกล่าวและคำแนะนำทีละขั้นตอนที่อธิบายว่า BERT สามารถใช้เพื่อส่งผ่านข้อมูลจาก R ไปยัง Excel โดยใช้รหัส VBA ที่น้อยที่สุดได้อย่างไร 1 8211 ดาวน์โหลดและติดตั้ง BERT จากลิงค์นี้ เมื่อการติดตั้งเสร็จสิ้นคุณควรจะมีเมนู Add-Ins ใหม่ใน Excel ด้วยปุ่มดังแสดงด้านล่าง นี่เป็นวิธีที่ BERT มีอยู่ใน Excel 2 8211 ดาวน์โหลดและติดตั้ง Custom UI editor ตัวแก้ไข UI ที่กำหนดเองช่วยในการสร้างเมนูและปุ่มที่กำหนดโดยผู้ใช้ใน Excel ribbon มีขั้นตอนการทำตามขั้นตอนที่นี่ คำแนะนำทีละขั้นตอน 1 8211 R รหัส: ฟังก์ชัน R ด้านล่างเป็นโค้ดที่ใช้งานง่ายสำหรับการอธิบายเท่านั้น จะคำนวณและคืนส่วนที่เหลือจากการถดถอยเชิงเส้น นี่คือสิ่งที่เราต้องการดึงข้อมูลใน Excel บันทึกไฟล์นี้ไว้ในไฟล์ myRCode. R (ชื่อใด ๆ ก็ได้ดี) ในไดเร็กทอรีที่คุณเลือก 2 8211 functions. R ใน BERT จาก Excel เลือก Add-Ins - gt Home Directory และเปิดไฟล์ที่ชื่อว่า functions. R ในไฟล์นี้วางรหัสต่อไปนี้ ตรวจสอบว่าคุณได้ใส่เส้นทางที่ถูกต้อง นี่เป็นเพียงการจัดหาไฟล์ BERT ที่ R ที่คุณสร้างไว้ข้างต้น จากนั้นให้บันทึกและปิดฟังก์ชั่นไฟล์ R หากคุณต้องการทำการเปลี่ยนแปลงใด ๆ ในไฟล์ R ที่สร้างขึ้นในขั้นตอนที่ 1 คุณจะต้องโหลดใหม่โดยใช้ปุ่ม BERT 8220Reload Startup File8221 จากเมนู Add-Ins ใน Excel 3 8211 ใน Excel: สร้างและบันทึกไฟล์ที่ชื่อ myFile. xslm (ชื่ออื่นใดก็ได้) นี่คือไฟล์ที่เปิดใช้งานมาโครที่คุณบันทึกไว้ในไดเร็กทอรีที่คุณเลือก เมื่อแฟ้มถูกบันทึกไว้ปิดมัน 4 8211 เปิดไฟล์ที่สร้างขึ้นข้างต้นใน Custom UI editor: เมื่อเปิดไฟล์แล้ววางโค้ดด้านล่าง คุณควรมีบางอย่างเช่นนี้ในตัวแก้ไข XML: โค้ด XML นี้จะสร้างเมนูเพิ่มเติม (RTrader) กลุ่มใหม่ (กลุ่มของฉัน) และปุ่มกำหนดเอง (New Button) ในริบบิ้น Excel เมื่อ you8217re เสร็จแล้วให้เปิด myFile. xslm ใน Excel และปิด Custom UI Editor คุณควรเห็นบางอย่างเช่นนี้ 5 8211 เปิดตัวแก้ไข VBA ใน myFile. xlsm แทรกโมดูลใหม่ วางโค้ดด้านล่างลงในโมดูลที่สร้างขึ้นใหม่ การดำเนินการนี้จะลบผลการค้นหาก่อนหน้าในแผ่นงานก่อนที่จะดำเนินการใหม่ 6 8211 คลิกปุ่ม New ตอนนี้กลับไปที่สเปรดชีตและในเมนู RTrader คลิกปุ่ม 8220New Button8221 คุณจะเห็นสิ่งที่ปรากฏด้านล่าง คู่มือข้างต้นเป็นรุ่นพื้นฐานของสิ่งที่สามารถทำได้โดยใช้ BERT แต่จะแสดงวิธีการรวมพลังของเครื่องมือที่เฉพาะเจาะจงหลายตัวเพื่อสร้างแอ็พพลิเคชันที่กำหนดเองของคุณเอง จากมุมมองของฉันความสนใจของวิธีดังกล่าวคือความสามารถในการกาวด้วยกัน R และ Excel ชัด แต่รวมถึง XML (และชุด) ชิ้นส่วนของโค้ดจาก Python, SQL และอื่น ๆ นี่คือสิ่งที่ฉันต้องการ สุดท้ายฉันอยากรู้ว่าใครมีประสบการณ์กับ BERT 19 สิงหาคม 2016, 9:26 น. เมื่อทดสอบกลยุทธ์การซื้อขายวิธีการทั่วไปคือการแบ่งข้อมูลเริ่มแรกที่ตั้งไว้ในตัวอย่างข้อมูล: ส่วนหนึ่งของข้อมูลที่ออกแบบมาเพื่อปรับเทียบ โมเดลและข้อมูลตัวอย่าง: ส่วนหนึ่งของข้อมูลที่ใช้ในการตรวจสอบการสอบเทียบและตรวจสอบว่าประสิทธิภาพที่สร้างขึ้นในตัวอย่างจะสะท้อนให้เห็นในโลกแห่งความจริง ตามกฎของหัวแม่มือประมาณ 70 ของข้อมูลเริ่มต้นสามารถใช้สำหรับการสอบเทียบ (เช่นในตัวอย่าง) และ 30 สำหรับการตรวจสอบ (เช่นออกจากตัวอย่าง) จากนั้นการเปรียบเทียบข้อมูลในและนอกของตัวอย่างช่วยในการตัดสินใจว่ารูปแบบนั้นมีประสิทธิภาพเพียงพอหรือไม่ โพสต์นี้มุ่งไปที่ขั้นตอนต่อไปและเป็นวิธีการทางสถิติในการตัดสินใจว่าข้อมูลตัวอย่างจะไม่ตรงกับสิ่งที่สร้างขึ้นในตัวอย่าง ในแผนภูมิด้านล่างพื้นที่สีน้ำเงินหมายถึงประสิทธิภาพตัวอย่างสำหรับกลยุทธ์ของฉัน การตรวจสอบภาพที่เรียบง่ายแสดงให้เห็นถึงความพอดีที่ดีระหว่างการเข้าและออกจากการทดสอบตัวอย่าง แต่ฉันมีความมั่นใจในระดับใดในขั้นตอนนี้ไม่มากนักและนี่เป็นปัญหา สิ่งที่จำเป็นอย่างแท้จริงคือการวัดความคล้ายคลึงกันระหว่างชุดข้อมูลตัวอย่างในและนอก ในแง่ทางสถิติอาจแปลได้ว่าเป็นไปได้ว่าตัวเลขการเข้าชมและออกจากตัวเลขประสิทธิภาพตัวอย่างมาจากการกระจายเดียวกัน มีการทดสอบสถิติที่ไม่ใช่พารามิเตอร์ที่ไม่ตรงนี้: การทดสอบ Kruskall-Wallis ความหมายที่ดีของการทดสอบนี้สามารถพบได้ในกลุ่มตัวอย่างของ R-Tutor 8220A ที่เก็บตัวอย่างข้อมูลได้โดยอิสระหากมาจากประชากรที่ไม่เกี่ยวกันและตัวอย่างเหล่านี้ไม่มีผลต่อกันและกัน ใช้การทดสอบ Kruskal-Wallis เราสามารถตัดสินใจได้ว่าการกระจายของประชากรจะเหมือนกันหรือไม่โดยสมมติว่าพวกเขาไม่ปฏิบัติตามการแจกแจงตามปกติ 8221 ผลประโยชน์เพิ่มเติมของการทดสอบนี้ไม่ได้เป็นการสมมติว่ามีการแจกแจงแบบปกติ มีการทดสอบอื่นที่มีลักษณะเดียวกับที่สามารถใส่ลงในกรอบดังกล่าวได้ การทดสอบ Mann-Whitney-Wilcoxon หรือการทดสอบ Kolmogorov-Smirnov จะเหมาะกับกรอบการทำงานนี้อย่างสมบูรณ์ แต่นี่ไม่ใช่ข้อ จำกัด ของบทความนี้เพื่อหารือเกี่ยวกับข้อดีข้อเสียของการทดสอบแต่ละข้อ สามารถดูคำอธิบายที่ดีพร้อมตัวอย่าง R ได้ที่นี่ Here8217s รหัสที่ใช้ในการสร้างแผนภูมิด้านบนและการวิเคราะห์: ในตัวอย่างข้างต้นในช่วงตัวอย่างมีค่าเกินกว่าระยะเวลาตัวอย่างดังนั้นฉันจึงสุ่มสร้าง 1000 ส่วนย่อยของข้อมูลตัวอย่างซึ่งแต่ละตัวมีความยาวเท่ากันหมด ของข้อมูลตัวอย่าง จากนั้นผมได้ทดสอบแต่ละชุดย่อยตัวอย่างเทียบกับข้อมูลตัวอย่างและบันทึกค่า p - กระบวนการนี้สร้างค่า p เดียวสำหรับการทดสอบ Kruskall-Wallis แต่เป็นการกระจายที่ทำให้การวิเคราะห์มีประสิทธิภาพมากขึ้น ในตัวอย่างนี้ค่าเฉลี่ย p - ค่าดีกว่าศูนย์ (0.478) แสดงให้เห็นว่าสมมติฐานที่เป็นโมฆะควรได้รับการยอมรับ: มีหลักฐานที่ชัดเจนว่าข้อมูลเข้าและออกจากตัวอย่างมาจากการกระจายเดียวกัน ตามปกติแล้วสิ่งที่นำเสนอในโพสต์นี้เป็นตัวอย่างของเล่นที่ทำหน้าที่ขูดขีดพื้นผิวของปัญหาเท่านั้นและควรปรับให้ตรงตามความต้องการของแต่ละบุคคล อย่างไรก็ตามผมคิดว่าข้อเสนอแนะนี้เป็นกรอบทางสถิติที่น่าสนใจและมีเหตุผลเพื่อประเมินผลลัพธ์จากผลการทดสอบตัวอย่าง โพสต์นี้ได้รับแรงบันดาลใจจากเอกสารสองฉบับต่อไปนี้: Vigier Alexandre, Chmil Swann (2007), ผลกระทบของฟังก์ชันการเพิ่มประสิทธิภาพต่างๆที่มีต่อประสิทธิภาพการทำงานตัวอย่างของกลยุทธ์การซื้อขายพันธุกรรมที่พัฒนาขึ้น, การคาดการณ์การประชุมตลาดการเงิน Vigier Alexandre, Chmil Swann (2010), กระบวนการเพิ่มประสิทธิภาพเพื่อปรับปรุงความสอดคล้องตัวอย่าง, กรณี Stock Market, การประชุมเชิงปริมาณ JP Morgan Cazenove Equity, London October 2010 13 ธันวาคม 2015, 2:03 pm การทำวิจัยเชิงปริมาณหมายถึงการกระทืบข้อมูลจำนวนมากและหนึ่งต้องการข้อมูลที่สะอาดและเชื่อถือได้ บรรลุเป้าหมายนี้ สิ่งที่จำเป็นจริงๆคือข้อมูลสะอาดที่สามารถเข้าถึงได้ง่าย (แม้จะไม่มีการเชื่อมต่ออินเทอร์เน็ต) วิธีที่มีประสิทธิภาพมากที่สุดในการทำเช่นนี้สำหรับฉันคือการรักษาชุดของไฟล์ csv แน่นอนกระบวนการนี้สามารถจัดการได้หลายวิธี แต่ฉันพบว่ามีประสิทธิภาพมากและง่ายทำงานล่วงเวลาเพื่อรักษาไดเรกทอรีที่ฉันเก็บและ update ไฟล์ csv ฉันมีไฟล์ csv หนึ่งไฟล์ต่อหนึ่งตราสารและไฟล์แต่ละไฟล์จะมีชื่อตามอุปกรณ์ที่มีอยู่ เหตุผลที่ฉันทำเช่นนั้นเป็นสองเท่า: ประการแรกฉัน don8217t ต้องการดาวน์โหลดข้อมูล (ราคา) จาก Yahoo, Google itd8230 ทุกครั้งที่ฉันต้องการทดสอบแนวคิดใหม่ ๆ แต่ที่สำคัญกว่าเมื่อฉันระบุและแก้ไขปัญหาแล้วฉัน don8217t ต้องการจะต้อง ทำอีกครั้งในครั้งต่อไปที่ฉันต้องการเครื่องดนตรีเดียวกัน เรียบง่ายและมีประสิทธิภาพมาก กระบวนการดังกล่าวสรุปได้จากตารางด้านล่าง ในทุกอย่างที่ตามมาผมถือว่าข้อมูลมาจาก Yahoo รหัสจะต้องได้รับการแก้ไขสำหรับข้อมูลจาก Google, Quandl ฯลฯ8230นอกจากนี้ฉันยังเสนอขั้นตอนการอัปเดตข้อมูลราคารายวัน การตั้งค่าจะแตกต่างกันสำหรับข้อมูลความถี่สูงและชุดข้อมูลประเภทอื่น ๆ (เช่นแตกต่างจากราคา) 1 8211 การดาวน์โหลดข้อมูลเบื้องต้น (listOfInstruments. R amp historicalData. R) ไฟล์ listOfInstruments. R คือไฟล์ที่มีเฉพาะรายการเครื่องมือทั้งหมด หากเครื่องไม่ได้เป็นส่วนหนึ่งของรายการของฉัน (เช่นไม่มีไฟล์ csv ในโฟลเดอร์ข้อมูล) หรือถ้าคุณทำเช่นนั้นเป็นครั้งแรกคุณต้องดาวน์โหลดชุดข้อมูลทางประวัติศาสตร์ในตอนแรก ตัวอย่างด้านล่างดาวน์โหลดชุดราคา ETFs ประจำวันจาก Yahoo Finance ตั้งแต่เดือนมกราคม 2000 และเก็บข้อมูลไว้ในไฟล์ CSV 2 8211 อัพเดตข้อมูลที่มีอยู่ (updateData. R) โค้ดด้านล่างนี้เริ่มจากไฟล์ที่มีอยู่ในโฟลเดอร์เฉพาะและอัปเดตข้อมูลทั้งหมดที่มีอยู่หลังจากที่อื่น ฉันมักจะเรียกใช้กระบวนการนี้ทุกวันยกเว้นเมื่อ I8217m ในวันหยุด หากต้องการเพิ่มเครื่องมือใหม่ให้ใช้ขั้นตอนที่ 1 ด้านบนสำหรับเครื่องนี้เพียงอย่างเดียว 3 8211 สร้างไฟล์แบทช์ (updateDailyPrices. bat) ส่วนที่สำคัญอีกอย่างหนึ่งของงานคือการสร้างไฟล์แบทช์ที่ทำให้กระบวนการอัปเดตทำงานโดยอัตโนมัติ (I8217m เป็นผู้ใช้ Windows) วิธีนี้จะหลีกเลี่ยงการเปิด RRStudio และเรียกใช้โค้ดจากที่นั่น รหัสด้านล่างจะอยู่ในไฟล์. bat (เส้นทางจะต้องมีการแก้ไขด้วยการตั้งค่า reader8217s) โปรดทราบว่าฉันได้เพิ่มไฟล์ที่ส่งออก (updateLog. txt) เพื่อติดตามการดำเนินการ ขั้นตอนข้างต้นเป็นเรื่องง่ายมากเพราะจะอธิบายเฉพาะวิธีการอัปเดตข้อมูลราคารายวันเท่านั้น I8217 ใช้เวลานี้มาเรื่อย ๆ และทำงานได้อย่างราบรื่นสำหรับฉันจนถึงตอนนี้ สำหรับข้อมูลขั้นสูงและความถี่ที่สูงขึ้นสิ่งต่างๆจะมีความซับซ้อนมากขึ้น ตามปกติความคิดเห็นใด ๆ ต้อนรับ 23 มีนาคม 2015, 8:55 น. เมื่อพูดถึงการจัดการพอร์ตการลงทุนของหุ้นเทียบกับเกณฑ์มาตรฐานปัญหาจะแตกต่างจากการกำหนดกลยุทธ์การคืนผลแน่นอน ในอดีตต้องถือหุ้นมากขึ้นกว่าในภายหลังซึ่งไม่มีหุ้นที่สามารถถือได้หากมีโอกาสไม่ดีพอ เหตุผลคือข้อผิดพลาดในการติดตาม นี่คือส่วนเบี่ยงเบนมาตรฐานของผลตอบแทนของพอร์ตการลงทุนลบด้วยผลตอบแทนจากการลงทุน มีการจัดเก็บหุ้นที่น้อยลงเทียบกับเกณฑ์มาตรฐานมากขึ้นจะทำให้เกิดข้อผิดพลาดในการติดตามได้มากขึ้น (เช่นความเสี่ยงที่สูงขึ้น) การวิเคราะห์ต่อไปนี้ได้รับแรงบันดาลใจมาจากหนังสือ 8220Active Portfolio Management8221 โดย Grinold amp Kahn นี่คือพระคัมภีร์สำหรับทุกคนที่สนใจในการทำผลงานกับมาตรฐาน ผมขอแนะนำให้ทุกคนที่มีความสนใจในหัวข้อนี้ในการอ่านหนังสือตั้งแต่ต้นจนจบ It8217s เขียนเป็นอย่างดีและวางรากฐานของการจัดการพอร์ตโฟลิโอที่ใช้งานอย่างเป็นระบบ (ฉันไม่มีความร่วมมือใด ๆ กับบรรณาธิการหรือผู้เขียน) 1 8211 Factor Analysis นี่เรากำลังพยายามจัดอันดับหุ้นในจักรวาลการลงทุนให้ได้มากที่สุดเท่าที่จะเป็นไปได้ หลายคนคิดค้นเครื่องมือและเครื่องมือมากมายที่พัฒนาขึ้นเพื่อให้บรรลุเป้าหมายนี้ ในบทความนี้ฉันมุ่งเน้นไปที่สองเมตริกที่ง่ายและใช้กันอย่างแพร่หลาย: ค่าสัมประสิทธิ์ข้อมูล (IC) และ Quantiles Return (QR) 1.1 8211 ค่าสัมประสิทธิ์ข้อมูลเส้นขอบฟ้าสำหรับผลตอบแทนที่ได้รับจะต้องถูกกำหนดโดยนักวิเคราะห์และ it8217s ซึ่งเป็นส่วนหนึ่งของการหมุนเวียนของกลยุทธ์8217และการสลายตัวของอัลฟา (ซึ่งเป็นหัวข้อที่ครอบคลุมการวิจัย) เห็นได้ชัดว่าไอซีจะต้องสูงที่สุดเท่าที่จะเป็นไปได้ในรูปแบบสัมบูรณ์ สำหรับผู้อ่านที่กระตือรือร้นในหนังสือโดย Grinold amp Kahn สูตรการเชื่อมโยง Information Ratio (IR) และ IC จะได้รับ: ด้วยความกว้างเป็นจำนวนของการเดิมพันที่เป็นอิสระ (ธุรกิจการค้า) สูตรนี้เรียกว่ากฎพื้นฐานของการจัดการที่ใช้งานอยู่ ปัญหาคือบ่อยครั้งที่การกำหนดความกว้างได้อย่างถูกต้องไม่ใช่เรื่องง่ายเหมือนกับเสียง 1.2 8211 Quantiles Return เพื่อให้มีการคาดการณ์ที่ถูกต้องยิ่งขึ้นเกี่ยวกับปัจจัยที่ทำให้พลังงานที่คาดการณ์ได้ it8217s จำเป็นที่จะต้องก้าวไปอีกขั้นหนึ่งและจัดกลุ่มหุ้นตามปริมาณของค่าปัจจัยต่างๆแล้ววิเคราะห์ค่าเฉลี่ยของผลตอบแทน (หรือตัวชี้วัดค่าเฉลี่ยของศูนย์กลางอื่น ๆ ) ของแต่ละกลุ่ม quantiles ประโยชน์ของเครื่องมือนี้ตรงไปตรงมา ปัจจัยหนึ่งสามารถมี IC ที่ดี แต่พลังการคาดการณ์อาจ จำกัด อยู่ที่จำนวนหุ้นที่น้อย ไม่ดีเท่าผู้จัดการด้านการลงทุนจะต้องเลือกหุ้นภายในจักรวาลทั้งหมดเพื่อให้เป็นไปตามข้อ จำกัด ข้อผิดพลาดในการติดตาม กลับ quantiles ดีมีลักษณะความสัมพันธ์ที่น่าเบื่อระหว่างแต่ละ quantiles และส่งกลับ. หุ้นทั้งหมดในดัชนี SampP500 (ในขณะที่เขียน) เห็นได้ชัดว่ามีอคติในการอยู่รอดของเรือ: รายการดัชนีหุ้นในดัชนีมีการเปลี่ยนแปลงอย่างมีนัยสำคัญระหว่างช่วงเริ่มต้นและช่วงสิ้นสุดของช่วงเวลาตัวอย่าง แต่ก็มีความสามารถเพียงพอสำหรับวัตถุประสงค์ในการแสดงเท่านั้น รหัสด้านล่างดาวน์โหลดราคาหุ้นแต่ละแบบใน SampP500 ระหว่างเดือน ม. ค. 2548 ถึงวันนี้ (ต้องใช้เวลาสักครู่) และจะเปลี่ยนราคาวัตถุดิบให้เป็นผลตอบแทนในช่วง 12 เดือนที่ผ่านมาและเดือนที่ผ่านมา อดีตเป็นปัจจัยของเราหลังจะใช้เป็นมาตรการส่งกลับ ด้านล่างนี้เป็นรหัสในการคำนวณค่าสัมประสิทธิ์ข้อมูลและปริมาณการส่งกลับ โปรดทราบว่าฉันใช้ quintiles ในตัวอย่างนี้ แต่สามารถใช้วิธีจัดกลุ่มอื่น ๆ (terciles, deciles etc8230) จริงๆมันขึ้นอยู่กับขนาดตัวอย่างสิ่งที่คุณต้องการจับภาพและสภาพอากาศที่คุณต้องการมีภาพรวมกว้างหรือมุ่งเน้นกระจายหาง สำหรับการประเมินผลตอบแทนภายในแต่ละกลุ่มค่ามัธยฐานถูกใช้เป็นตัวประมาณแนวโน้มกลาง มาตรการนี้มีความไวต่อค่าผิดปกติน้อยกว่าค่าเฉลี่ยเลขคณิต และสุดท้ายโค้ดเพื่อสร้างแผนภูมิ Quantiles Return 3 8211 วิธีการใช้ประโยชน์จากข้อมูลข้างต้นในแผนภูมิด้านบน Q1 จะกลับมาต่ำสุดในรอบ 12 เดือนและ Q5 สูงสุด มีการเพิ่มผลตอบแทนเชิงปริมาณในช่วง Q1 และ Q5 ที่เพิ่มขึ้นอย่างเห็นได้ชัดเกือบทุกอย่างซึ่งแสดงให้เห็นว่าหุ้นที่ลดลงใน Q5 ดีกว่าไตรมาสที่ 1 ประมาณ 1 ต่อเดือน นี่เป็นสิ่งที่มีความสำคัญและมีประสิทธิภาพสำหรับปัจจัยง่ายๆเช่น (ไม่แปลกใจเลยครับ) ดังนั้นเราจึงมีโอกาสที่จะเอาชนะดัชนีได้มากขึ้นโดยการถ่วงน้ำหนักหุ้นที่ลดลงสู่ไตรมาสที่ 5 และทำให้น้ำหนักลดลงเมื่อเทียบกับเกณฑ์มาตรฐาน IC ของ 0.0206 อาจไม่ได้หมายถึงการจัดการที่ดีในตัวเอง แต่ it8217s อย่างมีนัยสำคัญที่แตกต่างจาก 0 และบ่งบอกถึงพลังการคาดการณ์ที่ดีของที่ผ่านมา 12 เดือนกลับโดยรวม การทดสอบความสำคัญอย่างเป็นทางการสามารถประเมินได้ แต่สิ่งนี้อยู่นอกเหนือขอบเขตของบทความนี้ 4 8211 ข้อ จำกัด ในทางปฏิบัติกรอบการทำงานข้างต้นเป็นสิ่งที่ยอดเยี่ยมสำหรับการประเมินคุณภาพของปัจจัยการลงทุน 8272s อย่างไรก็ตามมีข้อ จำกัด ในทางปฏิบัติที่ต้องใช้ในการดำเนินการในชีวิตจริงคือการปรับสมดุล ในคำอธิบายด้านบน it8217s สันนิษฐานว่า ณ สิ้นเดือนของพอร์ตโฟลิโอจะปรับสมดุลได้อย่างเต็มที่ ซึ่งหมายความว่าหุ้นทั้งหมดที่ร่วงลงใน Q1 มีน้ำหนักน้อยและหุ้นทั้งหมดที่ตกอยู่ในไตรมาสที่ 5 มีน้ำหนักเกินเมื่อเทียบกับเกณฑ์มาตรฐาน นี่เป็นไปไม่ได้ที่จะเป็นไปได้ในทางปฏิบัติ: บางหุ้นอาจถูกแยกออกจากจักรวาลการลงทุนมีข้อจํากัดเกี่ยวกับอุตสาหกรรมหรือภาคน้ำหนักมีข้อจํากัดในการหมุนเวียนเป็นต้น 823 ต้นทุนการทำธุรกรรม สิ่งนี้ไม่ได้นำมาพิจารณาในการวิเคราะห์ข้างต้นและเป็นข้อบกพร่องร้ายแรงต่อการใช้ชีวิตจริง การพิจารณาการหมุนเวียนมักใช้ในชีวิตจริงในรูปของการลงโทษต่อคุณภาพของปัจจัย สัมประสิทธิ์การถ่ายเท นี่คือการขยายกฎหมายพื้นฐานของการจัดการที่ใช้งานอยู่และเป็นการผ่อนคลายสมมติฐานของแบบจำลอง Grinold8217s ที่ผู้บริหารไม่ต้องเผชิญกับข้อ จำกัด ใด ๆ ที่ทำให้พวกเขาไม่สามารถแปลข้อมูลเชิงลึกด้านการลงทุนของตนโดยตรงไปยังการเดิมพันในพอร์ตโฟลิโอ และสุดท้าย I8217m ประหลาดใจด้วยสิ่งที่สามารถทำได้ในน้อยกว่า 80 บรรทัดของรหัสกับ R8230 ตามปกติความคิดเห็นใด ๆ ต้อนรับ 14 มีนาคม 2014, 01:07 คำถามหนึ่งควรถาม himherself เมื่อใช้ตัวชี้วัดทางเทคนิคคือสิ่งที่จะเป็นวัตถุประสงค์ เกณฑ์การเลือกพารามิเตอร์ตัวบ่งชี้ (เช่นทำไมต้องใช้ RSI 14 วันมากกว่า 15 หรือ 20 วัน) อัลกอริทึมทางพันธุกรรม (GA) เป็นเครื่องมือที่เหมาะสำหรับตอบคำถามนี้ ในบทความนี้ I8217 จะแสดงวิธีการตั้งค่าปัญหาใน R. ก่อนดำเนินการเตือนตามปกติ: สิ่งที่ฉันนำเสนอในโพสต์นี้เป็นเพียงตัวอย่างของเล่นเท่านั้นไม่ใช่คำเชิญในการลงทุน ไม่ใช่กลยุทธ์ที่สมบูรณ์แบบ แต่เป็นแนวคิดการวิจัยที่ต้องมีการวิจัยพัฒนาและปรับแต่งตามความต้องการของแต่ละบุคคล ขั้นตอนวิธีเชิงพันธุกรรมคืออะไรคำอธิบายที่ดีที่สุดของ GA ที่ฉันมาจาก Cybernatic Trading เป็นหนังสือของ Murray A. Ruggiero 8220Genetic Algorithms ถูกคิดค้นโดย John Holland ในช่วงกลางปี 1970 เพื่อแก้ปัญหาการเพิ่มประสิทธิภาพอย่างหนัก วิธีนี้ใช้การคัดเลือกโดยธรรมชาติการอยู่รอดของ fittest8221 กระบวนการทั่วไปทำตามขั้นตอนด้านล่าง: เข้ารหัสปัญหาเป็นโครโมโซมใช้การเข้ารหัสการพัฒนาฟังก์ชั่นสมรรถภาพสำหรับใช้ในการประเมินแต่ละค่าโครโมโซม 8017 ในการแก้ปัญหาที่กำหนดเริ่มต้นประชากรโครโมโซมประเมินแต่ละโครโมโซมในประชากรสร้างโครโมโซมใหม่โดยการผสมพันธุ์สอง โครโมโซม (พ่อแม่จะถูกเลือกแบบสุ่ม แต่ลำเอียงโดยการออกกำลังกายของพวกเขา) ประเมินโครโมโซมใหม่ลบสมาชิกของประชากรที่ไม่พอดีกับโครโมโซมใหม่และใส่โครโมโซมใหม่ในประชากร . ถ้าเกณฑ์การยุติ (จำนวนสูงสุดของอายุเกณฑ์การออกกำลังกายดีพอ 823) ให้กลับโครโมโซมที่ดีที่สุดหรือไปที่ขั้นตอนที่ 4 จากมุมมองการซื้อขาย GA มีประโยชน์มากเพราะสามารถจัดการปัญหาที่ไม่เป็นเชิงเส้นได้มาก อย่างไรก็ตามคุณลักษณะเหล่านี้แสดงถึงคุณลักษณะที่น่ารังเกียจซึ่งน่าจะเป็นที่กล่าวถึง: เหมาะกว่า: นี่เป็นปัญหาหลักและทำให้นักวิเคราะห์วิเคราะห์ปัญหาในลักษณะที่ลดความเสี่ยงนี้ลง เวลาในการคำนวณ ถ้าปัญหา isn8217t ถูกกำหนดอย่างถูกต้องอาจใช้เวลานานมากในการเข้าถึงโซลูชันที่ดีและความซับซ้อนเพิ่มขึ้นอย่างมากตามจำนวนตัวแปร ดังนั้นความจำเป็นในการเลือกพารามิเตอร์อย่างรอบคอบ มีหลายแพคเกจ R เกี่ยวกับ GA ฉันเลือกที่จะใช้กันมากที่สุด: rgenoud ราคาปิดรายวันสำหรับ ETFs สภาพคล่องส่วนใหญ่จากการเงินของ Yahoo จะย้อนกลับไปในเดือนมกราคม 2000 ในช่วงตัวอย่างมาจากมกราคม 2000 ถึงธันวาคม 2010 Out of ระยะเวลาตัวอย่างจะเริ่มในเดือนมกราคม 2554 ตรรกะดังต่อไปนี้ฟังก์ชั่นการออกกำลังกายจะได้รับการปรับให้เหมาะกับช่วงเวลาตัวอย่างเพื่อให้ได้พารามิเตอร์ที่ดีที่สุดสำหรับตัวชี้วัดทางเทคนิคที่เลือก ผลการปฏิบัติงานของตัวชี้วัดเหล่านี้จะได้รับการประเมินในช่วงเวลาที่ตัวอย่าง แต่ก่อนที่จะทำเช่นนั้นตัวชี้วัดทางเทคนิคจะต้องได้รับการคัดเลือก ตลาดตราสารทุนมีลักษณะสำคัญสองอย่างที่คุ้นเคยกับทุกคนที่มีประสบการณ์ในการซื้อขาย โมเมนตัมระยะยาวและการกลับรายการระยะสั้น คุณลักษณะเหล่านี้สามารถแปลเป็นตัวชี้วัดทางเทคนิคได้จาก: moving averages cross over และ RSI ค่านี้แสดงถึงชุดของพารามิเตอร์ 4 ตัวคือช่วงเวลามองย้อนกลับสำหรับค่าเฉลี่ยเคลื่อนที่แบบระยะสั้นและระยะยาวช่วงเวลามองย้อนกลับของเกณฑ์ RSI และ RSI ชุดของพารามิเตอร์คือโครโมโซม องค์ประกอบสำคัญอื่น ๆ คือการออกกำลังกาย เราอาจต้องการใช้สิ่งที่ต้องการเช่นอัตราผลตอบแทนสูงสุดหรืออัตราส่วน Sharpe หรือค่าเฉลี่ยถ่วงน้ำหนักขั้นต่ำ ในสิ่งต่อไปนี้ฉันเลือกที่จะเพิ่มอัตราส่วน Sharpe การใช้ R คือชุดของ 3 ฟังก์ชัน: fitnessFunction กำหนดฟังก์ชันการออกกำลังกาย (เช่นอัตราส่วนชาร์ปสูงสุด) ที่จะใช้ภายในสถิติการซื้อขายเครื่องมือของ GA สรุปสถิติการซื้อขายสำหรับทั้งในและนอกช่วงเวลาตัวอย่างเพื่อวัตถุประสงค์ในการเปรียบเทียบ โปรแกรม GA จากแพคเกจ rgenoud ฟังก์ชั่น genoud ค่อนข้างซับซ้อน แต่ I8217m จะไม่อธิบายว่าพารามิเตอร์แต่ละข้อมีความหมายอย่างไรเนื่องจากฉันต้องการเก็บบทความนี้สั้น ๆ (และเอกสารเป็นสิ่งที่ดีมาก) ในตารางด้านล่างผมจะนำเสนอพารามิเตอร์ที่เหมาะสมที่สุด (RSI look-back period, RSI threshold, Movement Average เฉลี่ยระยะยาวและ Average Moving Average) พร้อมกับสถิติการเข้าและออกตัวอย่าง ก่อนที่จะแสดงความคิดเห็นข้างต้นฉันต้องการอธิบายประเด็นสำคัญบางประการ เพื่อให้ตรงกับตรรกะที่กำหนดข้างต้นฉันได้กำหนดพารามิเตอร์ไว้เพื่อให้แน่ใจว่าระยะเวลาย้อนกลับของค่าเฉลี่ยเคลื่อนที่ในระยะยาวนั้นยาวกว่าค่าเฉลี่ยเคลื่อนที่ที่สั้นลง ฉันยัง จำกัด การเพิ่มประสิทธิภาพให้เลือกเฉพาะโซลูชันที่มีมากกว่า 50 ธุรกิจการค้าในช่วงเวลาตัวอย่าง (เช่นความสำคัญทางสถิติ) โดยรวมผลลัพธ์จากตัวอย่างไม่ได้น่าประทับใจ ผลตอบแทนต่ำแม้ว่าจำนวนธุรกิจการค้าจะมีขนาดเล็กเพื่อให้ผลลัพธ์มีความสำคัญมาก อย่างไรก็ตามการสูญเสียประสิทธิภาพอย่างมีนัยสำคัญระหว่างการเข้าและออกจากกลุ่มตัวอย่างสำหรับประเทศญี่ปุ่น (EWJ) ซึ่งน่าจะหมายถึงการปรับตัวให้เหมาะสม โพสต์นี้มีวัตถุประสงค์เพื่อมอบเครื่องมือให้ผู้อ่านใช้ GA อย่างถูกต้องในกรอบการทำธุรกรรมเชิงปริมาณ อีกครั้ง It8217s เป็นตัวอย่างที่ต้องได้รับการขัดเกลาเพิ่มเติม การปรับปรุงศักยภาพในการสำรวจคือการออกกำลังกาย การเพิ่มอัตราส่วน Sharpe เป็นเรื่องง่ายมาก ฟังก์ชัน 8220smarter8221 จะช่วยปรับปรุงรูปแบบสถิติการซื้อขายตัวอย่างตัวอย่าง เราพยายามจับภาพแบบตรงไปตรงมามาก จำเป็นต้องมีการวิจัยในเชิงลึกมากขึ้น การเพิ่มประสิทธิภาพ มีหลายวิธีในการปรับปรุงวิธีดำเนินการเพิ่มประสิทธิภาพ วิธีนี้จะช่วยเพิ่มความเร็วในการคำนวณและความมีเหตุมีผลของผลลัพธ์ รหัสที่ใช้ในโพสต์นี้มีอยู่ในที่เก็บ Gist ตามปกติแล้วความคิดเห็นใด ๆ ที่ยินดีต้อนรับ 28 กุมภาพันธ์ 2014, 15:52 น. มีเนื้อหาทางวรรณกรรมมากมายมหาศาลทั้งด้านวิชาการและเชิงประจักษ์เกี่ยวกับการคาดการณ์ของตลาด โดยส่วนใหญ่จะผสมผสานคุณสมบัติทางการตลาด 2 รูปแบบ ได้แก่ Magnitude and Direction ในบทความนี้ฉันต้องการเน้นการระบุทิศทางตลาดเท่านั้น เป้าหมายที่ฉันตั้งค่าไว้คือการระบุสภาวะตลาดเมื่ออัตราเดิมพันมีความลำเอียงต่อตลาดขึ้นหรือลง โพสต์นี้ให้ตัวอย่างของวิธีการใช้งาน CART (การจัดหมวดหมู่และการถดถอย) ในบริบทนี้ ก่อนที่ฉันจะดำเนินการเตือนตามปกติ: สิ่งที่ฉันนำเสนอในโพสต์นี้เป็นเพียงตัวอย่างของเล่นและไม่ใช่คำเชิญในการลงทุน ไม่ใช่กลยุทธ์ที่สมบูรณ์แบบ แต่เป็นแนวคิดการวิจัยที่ต้องมีการวิจัยพัฒนาและปรับแต่งตามความต้องการของแต่ละบุคคล 1 8211 ตะกร้าคืออะไรและทำไมถึงใช้มันจากสถิติ CART คือชุดของเทคนิคสำหรับการจัดหมวดหมู่และการคาดเดา เทคนิคนี้มีจุดมุ่งหมายเพื่อสร้างกฎที่ทำนายค่าของตัวแปรผลลัพธ์ (เป้าหมาย) จากค่าตัวแปรพยากรณ์ (อธิบาย) ที่รู้จักกันดี มีการใช้งานที่แตกต่างกันมาก แต่พวกเขาทั้งหมดมีลักษณะทั่วไปและสิ่งที่ Im สนใจมาจากวิกิพีเดียอัลกอริธึมสำหรับการสร้างต้นไม้ตัดสินใจมักจะทำงานจากบนลงล่างโดยการเลือกตัวแปรในแต่ละขั้นตอนที่ดีที่สุดในการแบ่งชุดของไอเท็ม อัลกอริทึมต่างๆใช้เมตริกที่แตกต่างกันสำหรับการวัด 8220best8221 เหล่านี้โดยทั่วไปจะวัดความสม่ำเสมอของตัวแปรเป้าหมายภายในส่วนย่อย เมตริกเหล่านี้ถูกนำไปใช้กับเซตย่อยย่อยแต่ละชุดและค่าที่เป็นผลลัพธ์จะรวมกัน (เช่นค่าเฉลี่ย) เพื่อวัดคุณภาพของการแบ่ง CART มีลักษณะบางอย่างที่เหมาะสำหรับการวิเคราะห์ตลาดอย่างมาก: Non parametric รถเข็นสามารถจัดการประเภทของการกระจายทางสถิติใด ๆ ที่ไม่ใช่เชิงเส้น CART สามารถจัดการคลื่นความถี่ขนาดใหญ่ระหว่างการพึ่งพาระหว่างตัวแปร (เช่นไม่ จำกัด เฉพาะความสัมพันธ์เชิงเส้น) ทนทานต่อความผิดพลาดมี R แพ็กเกจต่างๆที่เกี่ยวข้องกับ Recursive Partitioning ฉันใช้ที่นี่สำหรับการประมาณต้นไม้และ rpart. plot สำหรับการวาดภาพของต้นไม้ 2 8211 การออกแบบการทดลองแอ็พแอมการออกแบบราคา OHLC รายวันสำหรับ ETF ที่มีสภาพคล่องมากที่สุดตั้งแต่เดือนมกราคม 2000 ถึงธันวาคม 2013 ที่แยกออกจากการเงินของ Google ระยะเวลาตัวอย่างในช่วงมกราคม 2000 ถึงธันวาคม 2010 ส่วนที่เหลือของชุดข้อมูลคือช่วงเวลาที่ไม่อยู่ในตัวอย่าง ก่อนที่จะดำเนินการวิเคราะห์ประเภทใด ๆ ชุดข้อมูลจะต้องเตรียมพร้อมสำหรับงาน ตัวแปรเป้าหมายคือผลตอบแทนย้อนหลังของ ETF รายสัปดาห์ตามที่ระบุไว้ในสถานะของทั้งสองประเทศ (ขึ้นหรือลง) ถ้ารายสัปดาห์ส่งกลับ gt 0 แล้วตลาดในรัฐ UP, ลงเป็นอย่างอื่นตัวแปรอธิบายคือชุดของตัวบ่งชี้ทางเทคนิคที่ได้จากชุดข้อมูล OHLC วันแรกเริ่มต้น ตัวบ่งชี้แต่ละตัวบ่งชี้ถึงพฤติกรรมทางการตลาดที่ได้รับการรับรองเป็นอย่างดี เพื่อลดเสียงรบกวนในข้อมูลและเพื่อพยายามระบุความสัมพันธ์ที่แข็งแกร่งแต่ละตัวแปรอิสระจะถือว่ามีผลแบบไบนารี ความผันผวน (VAR1) ความผันผวนสูงมักเกี่ยวข้องกับตลาดที่ต่ำลงและมีความผันผวนน้อยเมื่อเทียบกับตลาดที่เพิ่มขึ้น ความผันผวนคือค่าเฉลี่ย ATR (Average True Range 20 วัน) ที่กระจายอยู่ในค่าเฉลี่ยเคลื่อนที่ (MA) หากเป็น ATR GT MA ดิบแล้ว VAR1 1 อื่น VAR1 -1 โมเมนตัมระยะสั้น (VAR2) ตลาดตราสารทุนแสดงพฤติกรรมโมเมนตัมในระยะสั้นที่จับได้ที่นี่โดยค่าเฉลี่ยเคลื่อนที่เฉลี่ย 5 วัน (SMA) ถ้าราคา gt SMA แล้ว VAR2 1 อื่น VAR2 -1 โมเมนตัมระยะยาว (VAR3) ตลาดตราสารทุนแสดงพฤติกรรมโมเมนตัมในระยะยาวที่จับได้ที่นี่โดยเฉลี่ยเคลื่อนที่ 50 วัน (LMA) หากราคา gt LMA แล้ว VAR3 1 อื่น VAR3 -1 การกลับรายการระยะสั้น (VAR4) นี่คือ CRTDR ซึ่งย่อมาจาก Close Relative To Daily Range และคำนวณเป็นดังนี้:. ถ้า CRTDR gt 0.5 แล้ว VAR4 1 else VAR4 -1 การปกครองแบบอัตโนมัติ (VAR5) ตลาดตราสารทุนมีแนวโน้มที่จะผ่านช่วงเวลาของระบบการปกครองแบบเผด็จการเชิงบวกและเชิงลบ ถ้าส่งกลับค่าความสัมพันธ์ในช่วง 5 วันที่ผ่านมา gt 0 แล้ว VAR5 1 else VAR5 -1 ฉันใส่คำอธิบายใต้ต้นไม้ตัวอย่างเช่นต้นไม้ต้นทางเส้นทางไปถึงโหนด 4 คือ VAR3 gt0 (Momentum ระยะยาว GT 0) และ VAR4 gt0 (CRTDR gt0) สี่เหลี่ยมสีแดงแสดงว่าเป็นใบลง (เช่นโหนดปลายทาง) มีความเป็นไปได้ที่ 58 (1 8211 0.42) ในแง่ของตลาดหมายความว่าถ้า Momentum ระยะยาวขึ้นและ CRTDR เท่ากับ gt 0.5 แล้วความเป็นไปได้ที่จะได้รับผลตอบแทนเป็นบวกในสัปดาห์หน้าจะเท่ากับ 42 ตามตัวอย่างข้อมูลตัวอย่าง 18 แสดงสัดส่วนของชุดข้อมูลที่ตกอยู่ในโหนดปลายทาง (เช่นใบ) มีหลายวิธีที่จะใช้วิธีการข้างต้นผมเลือกที่จะประมาณและรวมต้นไม้ที่เป็นไปได้ทั้งหมด จากตัวอย่างข้อมูลฉันเก็บใบทั้งหมดจากต้นไม้ที่เป็นไปได้ทั้งหมดและฉันรวบรวมไว้ในเมทริกซ์ นี่คือ 8220rules matrix8221 ที่ให้ความน่าจะเป็นของสัปดาห์หน้าในการขึ้นหรือลง ฉันใช้กฎในเมทริกซ์ข้างต้นกับข้อมูลตัวอย่าง (มกราคม 2011 8211 ธ. ค. 2013) และฉันจะเปรียบเทียบผลลัพธ์กับผลลัพธ์ที่แท้จริง ปัญหาเกี่ยวกับแนวทางนี้คือจุดเดียว (สัปดาห์) อาจตกอยู่ในกฎต่างๆและแม้แต่กฎ UP และ DOWN ในเวลาเดียวกัน ดังนั้นผมจึงใช้รูปแบบการออกเสียงลงคะแนน สำหรับสัปดาห์ที่กำหนดฉันสรุปกฎทั้งหมดที่ใช้กับสัปดาห์ที่ให้ค่า 1 สำหรับกฎ UP และ -1 สำหรับกฎการลง ถ้าผลรวมมากกว่า 0 สัปดาห์จะถูกจัดเป็น UP หากผลรวมเป็นลบ it8217s หนึ่งสัปดาห์ DOWN และถ้าผลรวมเท่ากับ 0 จะไม่มีตำแหน่งที่นำมาสัปดาห์นั้น (return 0) วิธีการข้างต้นถูกนำไปใช้กับ a ชุดของ ETFs ของเหลวมาก ฉันพล็อตด้านล่างเส้นโค้งของส่วนของกลุ่มตัวอย่างพร้อมกับกลยุทธ์การซื้อและถือในช่วงเวลาเดียวกัน ผลลัพธ์เบื้องต้นดูเหมือนจะเป็นประโยชน์แม้ว่าคุณภาพของผลลัพธ์จะแตกต่างกันไปมากโดยใช้เครื่องมือ อย่างไรก็ตามมีห้องพักขนาดใหญ่สำหรับการปรับปรุง ฉันใส่ด้านล่างบางเส้นทางสำหรับการวิเคราะห์เพิ่มเติม Path optimality อัลกอริทึมที่ใช้ในการกำหนดต้นไม้จะมีความเหมาะสมที่สุดในแต่ละการแยก แต่มันไม่รับประกันความถูกต้องของเส้นทาง การเพิ่มเมตริกเพื่อวัดความเหมาะสมของเส้นทางจะเป็นการปรับปรุงผลการค้นหาข้างต้นอย่างแน่นอน ตัวแปรอื่น ๆ ฉันเลือกตัวแปรอธิบายตามประสบการณ์ It8217s มีโอกาสมากที่ทางเลือกนี้ไม่ดีและไม่ดีนัก วิธีการทำ backtest ฉันใช้วิธีการแบบตัวอย่างเข้าและออกอย่างง่าย ในแบบทดสอบที่เป็นทางการมากขึ้นผมค่อนข้างจะใช้กลิ้งหรือขยายหน้าต่างของในและออกตัวอย่างช่วงย่อย (เช่นเดินไปข้างหน้าการวิเคราะห์) ตามปกติความคิดเห็นใด ๆ welcomeSmartQuant เป็น บริษัท ซอฟต์แวร์ทางการเงินที่มีการพัฒนาโครงสร้างพื้นฐานการซื้อขายแบบ algo end-to-end สำหรับเชิงปริมาณ กองทุนป้องกันความเสี่ยงและกลุ่มการค้าสถาบัน OpenQuant และรุ่นต่อไปของ OpenQuant2014 ปัจจุบันผลิตภัณฑ์เรือธง SmartQuants เป็นแพลตฟอร์มการพัฒนาระบบการซื้อขายอัตโนมัติและอัลกอริธึม (ATS) OpenQuant มี IDE (Integrated Development Environment) ที่ให้ข้อมูลเกี่ยวกับ quants และ traders ด้วยการวิจัยด้านยุทธศาสตร์ด้านอุตสาหกรรมการพัฒนาการดีบักการทำ backtesting การจำลองการเพิ่มประสิทธิภาพและระบบอัตโนมัติ QuantDesk เป็นโซลูชันแบบ end-to-end ที่สมบูรณ์แบบสำหรับกองทุนขนาดเล็กทุกขนาด ประกอบด้วย OpenQuant IDE (เซิร์ฟเวอร์ข้อมูลตลาดที่มีฟีดข้อมูลเรียลไทม์และการจัดการข้อมูลทางประวัติศาสตร์แบบรวมศูนย์), QuantTrader (เครื่องมือการปรับใช้การผลิตสำหรับกลยุทธ์การซื้อขายอัตโนมัติที่พัฒนาขึ้นโดย OpenQuant) และ QuantController . แอ็พพลิเคชันเซิร์ฟเวอร์ซึ่งเติมเต็ม QuantDesk เพื่อให้สามารถจัดการสถาปัตยกรรมการค้าอัจฉริยะ SmartQuants ได้อย่างมีประสิทธิภาพ QuantWeb เป็น QuantDesk เวอร์ชันคลาวด์ที่มีส่วนหน้าเว็บเบราว์เซอร์ ลงทะเบียนและรับบัญชีสาธิต QuantWeb ฟรี ความแตกต่างหลักระหว่างรูปแบบการซื้อขายเชิงปริมาณและการตัดสินใจคือลักษณะโดยระบบของวิธีการเชิงควอนตัม ในขณะที่นักลงทุนส่วนใหญ่เป็นเหมือนศิลปิน แต่ quants มีแนวโน้มที่จะใช้กระบวนการผลิตที่ซับซ้อนและต้องใช้โครงสร้างพื้นฐานด้านความแข็งแรงของอุตสาหกรรมโดยที่ไม่สามารถรักษาระดับความจำเป็นของระเบียบวินัยอย่างเป็นระบบได้ อย่างไรก็ตามการเริ่มต้นใช้งานไม่ได้รับการยกเว้นจากกฎนี้ แต่โชคดีที่หนึ่งไม่จำเป็นต้องสร้างโรงงานทั้งหมดจากพื้นดินขึ้น การใช้โครงสร้างการซื้อขายอัจฉริยะ SmartQuant ช่วยให้ผู้จัดการที่เกิดขึ้นใหม่ให้ความสำคัญกับวัตถุประสงค์หลักของพวกเขาซึ่งก็คือการพัฒนากลยุทธ์การลงทุนในขณะที่ได้รับประโยชน์จากกรอบความน่าเชื่อถือในการติดตั้งและใช้งานได้ในตลาด แน่นอนว่าเรายังคงใช้เวลาทดลองทดลองและทดสอบกลยุทธ์ต่างๆกันเป็นจำนวนมาก การมีสภาพแวดล้อมการพัฒนาที่ดีไม่จำเป็นต้องทำให้คุณสามารถข้ามขั้นตอนนั้นได้ ประโยชน์ที่แท้จริงของกรอบการออกแบบที่ดีคือการตัดเวลาระหว่างการทดสอบและการผลิตให้เหลือน้อยที่สุดและในลักษณะที่ปรับขนาดได้ของโครงสร้างพื้นฐานซึ่งสามารถเติบโตไปพร้อมกับ บริษัท จากการจัดการทุนเมล็ดพันธุ์ขนาดเล็กไปจนถึงระดับสถาบันอย่างแท้จริง ด้วยระบบแบบนี้ผู้จัดการที่เกิดขึ้นใหม่สามารถรู้สึกถึงความได้เปรียบในด้านการเล่นในขณะที่ซื้อขายในตลาดเดียวกับคู่แข่งที่มีขนาดใหญ่กว่ามากและสามารถรับรู้ถึงข้อได้เปรียบโดยธรรมชาติของการคล่องตัวและปรับตัวได้ Arthur M. Berd ผู้ก่อตั้งและ CEO, General Quantitative, LLC ลิขสิทธิ์ 1997-2016 SmartQuant Ltd infosmartquant
Comments
Post a Comment