ไม่พบผลการค้นหา
โอเพนเอไอไฟว์ ปัญญาประดิษฐ์ตัวใหม่ชนะทีมแชมป์โลกเกมโดตา 2 อย่างขาดลอย ทางผู้ผลิตชี้ว่า การนำเอไอมาแข่งเกมเป็นสนามทดสอบที่ดี แต่เป้าหมายคือ การพัฒนาปัญญาประดิษฐ์ทั่วไป เพื่อนำไปใช้ประโยชน์กับมนุษย์ เช่น แขนหุ่นยนต์ที่ขยับได้คล่องแคล่วไม่ต่างจากมนุษย์

หลังความพ่ายแพ้ของตัวแทนมนุษยชาติต่อแอลฟาโกะ (AlphaGo) ข่าวคราวชัยชนะของปัญญาประดิษฐ์ยังคงปรากฏให้เห็นอยู่เป็นระยะ และล่าสุดปัญญาประดิษฐ์โอเพนเอไอไฟว์ (OpenAI Five) ก็เอาชนะทีมแชมป์โลกเกมวางแผนยุทธศาสตร์ต่อสู้แบบเรียลไทม์ โดตา 2 (Dota 2) ในปีที่แล้วอย่างขาดลอย

โอเพนเอไอ (OpenAI) องค์กรวิจัยปัญญาประดิษฐ์ ส่งเอไอแข่งเกมโดตา 2 ชนะทีมแชมป์โลกไปในการแข่งขันอีสปอร์ต โอเพนเอไอไฟว์ไฟนอลส์ (OpenAI Five Finals) ซึ่งทางองค์กรจัดขึ้นเองที่เมืองซานฟรานซิสโก เมื่อวันที่ 13 เมษายนที่ผ่านมา

ในการต่อสู้ระหว่างมนุษย์ และปัญญาประดิษฐ์ครั้งนี้ เป็นการแข่งขันแบบชนะ 2 ใน 3 โดย ฝ่ายมนุษย์คือผู้เล่น 5 คนจากทีมโอจี (OG) ซึ่งเพิ่งชนะรางวัลในดิอินเตอร์เนชันแนล 2018 (The International 2018) รายการแข่งขันอีสปอร์ตที่มีมูลค่าสูงสุดในโลกไปเมื่อปีที่แล้ว โดยมูลค่ารางวัลรวมของการแข่งครั้งนั้นอยู่ที่ 25 ล้านเหรียญสหรัฐฯ หรือประมาณ 794 ล้านบาท

ทีมฝ่ายเอไอนั้นเป็นบอท 5 ตัวจากโอเพนเอไอ ซึ่งใช้การเรียนรู้แบบเสริมแรงเชิงลึก (deep reinforcement learning) โดยแต่ละตัวบังคับแยกส่วนกัน แต่ใช้อัลกอริทึมชุดเดียวกัน การเรียนรู้แบบเสริมแรงที่ใช้กับเอไอชุดนี้นั้นเริ่มโดยปล่อยให้เอไอเข้าสู่เกมโดยไม่มีข้อมูลความรู้ใดๆ เกี่ยวกับเกมเลยว่าเล่นอย่างไร แล้วให้เอไอลองผิดลองถูก ฝึกฝนอย่างหนักโดยใช้ระบบการให้รางวัล และเครื่องมือการจูงใจอื่นๆ คอยเสริมแรงเมื่อเอไอทำพฤติกรรมบางอย่างสำเร็จ เช่น ฆ่าศัตรู หรือชนะเกม

เกรก บร็อกแมน (Greg Brockman) ผู้ร่วมก่อตั้งและประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของโอเพนเอไอ เล่าว่า ปัญญาประดิษฐ์โอเพนเอไอไฟว์พัฒนาตัวเองด้วยการเร่งเล่นในสภาพแวดล้อมจำลอง

“โอเพนเอไอไฟว์ขับเคลื่อนด้วยระบบการเรียนรู้เสริมแรงเชิงลึก ซึ่งหมายความว่าทางบริษัทไม่ได้โปรแกรมคำสั่งว่าต้องเล่นยังไง แต่เราโปรแกรมไว้ว่ามันต้องเรียนรู้ยังไง” บร็อกแมนกล่าวไว้ก่อนเริ่มการแข่งขันและเสริมว่า ภายในระยะเวลา 10 เดือนที่เอไอตัวนี้มีตัวตนขึ้นมา จำนวนเวลาที่มันใช้เล่นโดตา 2 นั้นเทียบเท่ากับช่วงเวลา 45,000 ปี

แม้ปัญญาประดิษฐ์โอเพนเอไอไฟว์ตัวนี้ จะเคยพ่ายแพ้ให้ทีมระดับโลกสองทีมเมื่อปีที่แล้ว แต่นั่นก็เป็นเพียงหนึ่งในกระบวนการเรียนรู้สำหรับเอไอเท่านั้น และข้อมูลประสบการณ์นั้นก็ส่งผลให้โอเพนเอไอชนะการแข่งขันในคราวนี้ไปได้แบบ 2 ตาติดต่อกันโดยไม่ปล่อยให้มนุษย์ชนะอีกเลย

อย่างไรก็ตาม ในการแข่งขันดังกล่าวมีข้อจำกัดที่แตกต่างจากการเล่นปกติอยู่บ้าง ขณะที่เกมโดตา 2 มีตัวละครกว่า 100 ตัว ในการแข่งขันครั้งนี้จำกัดให้ทั้งสองฝ่ายเลือกตัวละครจาก 17 ตัวที่คัดมาแล้วเท่านั้น และไอเทมรวมถึงความสามารถบางอย่าง โดยเฉพาะการแยกร่าง หรืออัญเชิญก็ถูกปิดไว้ เนื่องจากเป็นตัวแปรเสริมที่เอไอยังไม่ได้ทำการเรียนรู้ นอกเหนือจากนี้ เงื่อนไขทุกอย่างเหมือนกับการแข่งขันโดตา 2 ตามปกติทุกประการ ซึ่งชนะโดยการทำลายปราการใหญ่ ของฝ่ายตรงข้าม

สิ่งหนึ่งที่อาจเห็นได้จากการแข่งขันในครั้งนี้ และความพ่ายแพ้ในปีก่อนคือ โอเพนเอไอไฟว์มีลักษณะการเล่นที่ดุดัน และแสดงพฤติกรรมที่ก่อให้เกิดประโยชน์กับตัวเองในระยะสั้นทันทีเป็นหลัก ซึ่งทำให้ทุกครั้งมันจะสามารถกดดันมนุษย์อย่างหนักได้ตั้งแต่ช่วงต้นเกม (ประมาณ 20 นาทีแรก) ยิ่งเมื่อความพ่ายแพ้เมื่อปีก่อนนั้นเกิดขึ้นในช่วงท้ายเกม (นาทีที่ 40 ขึ้นไป) จึงอาจกล่าวได้ว่าเอไอตัวนี้มุ่งเน้นการรับมือกับสถานการณ์เฉพาะหน้า แต่ยังคงบกพร่องในเรื่องของการวางแผนระยะยาวอย่างมนุษย์อยู่

กระนั้นชัยชนะของเอไอตัวนี้ก็เป็นหนึ่งในหมุดหมายสำคัญว่า วิธีการเรียนรู้แบบเสริมแรงเชิงลึกสำหรับเอไอนั้นได้ผลในระดับหนึ่ง และทางทีมวิจัยจะไม่มีการจัดสาธิตเอไอตัวนี้ต่อสาธารณชนอีก แต่กำลังหันไปพัฒนาซอฟต์แวร์ที่ช่วยให้มนุษย์ทำงานร่วมกับโอเพนเอไอไฟว์ได้แบบเรียลไทม์แทนซึ่งอาจไม่เปิดเผยต่อสาธารณะ

นอกจากนี้ ยังมีการปล่อยแพลตฟอร์มสำหรับให้สาธารณชนได้เล่นโดตา 2 กับโอเพนเอไอไฟว์ได้ โดยจะเปิดโหมด โอเพนไฟว์อีนา (OpenAI Five Arena) ให้ท้าสู้เป็นเวลา 3 วันตั้งแต่วันที่ 18 เมษายน 2019 เป็นต้นไป สำหรับผู้ที่ลงทะเบียนโดยเล่นผ่านทางตัวเกมโดตา 2 ตามปกติของทางสตีม ทางองค์กรมองว่า โหมดอารีนาจะเป็นการทดลองสาธารณะที่ทำให้เอไอได้เรียนรู้จากผู้เล่นที่หลากหลาย ทั้งผู้เล่นที่จัดทีมต่อสู้แบบ 5 ต่อ 5 กับเอไอ และผู้เล่นที่เลือกจะอยู่ในฝ่ายเดียวกับเอไอ

แซม อัลต์แมน (Sam Altman) ผู้ร่วมก่อตั้งและประธานบริหารของโอเพนเอไอ กล่าวว่า โอเพนเอไอมีแนวโน้มที่จะทดสอบกับโดตา 2 และสภาพแวดล้อมในเกมอื่นๆ อีก ด้วยเหตุผลสำคัญว่าเกมเหล่านี้เป็นพื้นที่ที่ดีสำหรับทดสอบและประเมินผลการคืบหน้าของพัฒนาการ สำหรับในภาพกว้างของอุตสาหกรรมเทคโนโลยีปัญญาประดิษฐ์นั้น การเชี่ยวชาญในวิดีโอเกมต่างๆอาจกลายเป็นเรื่องล้าสมัยในเร็วๆ นี้ การเอาชนะเกมเดิมพันพื้น��านนั้นจำเป็นสำหรับการพิสูจน์ว่าระบบที่สร้างสามารถพัฒนาได้เร็ว และตอบสนองในทางที่สอดรับกับหน้าที่ในโลกความเป็นจริงซึ่งหนักหนากว่าและเกิดประโยชน์ซึ่งมีความหมายมากกว่า

เนื่องจากในท้ายที่สุดแล้ว โอเพนเอไอต้องการจะนำการเรียนรู้โดตา 2 ไปขยายผลในพื้นที่อื่นๆ นอกจากเกม และออกสู่ความเป็นจริงในที่สุด เพื่อการนั้น ทางองค์กรจึงกำลังพัฒนาการใช้การเรียนรู้แบบเสริมแรงและเทคนิคอื่นๆ เพื่อพัฒนาให้แขนหุ่นยนต์สามารถเคลื่อนไหวได้คล่องแคล่ว แม่นยำ และคล้ายคลึงกับมนุษย์

อัลต์แมนกล่าวถึงการสร้างปัญญาประดิษฐ์อเนกประสงค์ซึ่งทำสิ่งที่มนุษย์ทำได้ หรือกล่าวคือปัญญาประดิษฐ์ทั่วไป (AGI) ซึ่งเป็นวิวัฒนาการขั้นต่อไปของเอไอ เป็นไปแบ่งปันประโยชน์ให้กับโลกโดยทำให้มั่นใจด้วยว่ามันปลอดภัย

“เราไม่ได้ทำงานนี้เพื่อจะชนะการแข่งเกม แม้มันจะสนุกก็ตาม เราทำงานนี้เพื่อเปิดเผยความลับซึ่งจะนำไปสู่การสร้างปัญญาประดิษฐ์ทั่วไป” อัลต์แมนกล่าว

ที่มา:

On Being
198Article
0Video
0Blog