TECHNOLOGY_YANISA

อ่านคิดวิเคราะห์และเขียนสื่อความ

มัธยมศึกษาปีที่ 5 วิชาการงานอาชีพและเทคโนโลยี

ชื่อ ญาณิศา วงศ์ชูลิขิต ชั้น ม.5/4 เลขที่ 8

...................................................................................................................................................................

เรื่อง : ความรู้เกี่ยวกับ Machine learning

(เนื้อหาและภาพประกอบ)

Machine Learning คือ การทำให้ระบบคอมพิวเตอร์เรียนรู้ได้ด้วยตนเอง โดยใช้ข้อมูล

ซึ่งแตกต่างกับการเขียนโปรแกรมทั่วไป เพราะ Programming เราจะใส่ ข้อมูล (Data) และ Program เข้าไปเพื่อให้ได้ Output แต่ Machine Learning เราไม่ได้ Program คำตอบ เราใส่ Data และ Output (ผลลัพธ์) เข้าไป เพื่อให้หา Program ที่จะนำไปตอบในอนาคตได้ว่า Input แบบนี้ Output จะเป็นอะไร

ประเภทหลักๆของ Machine Learning
Supervised Learning — เรียนรู้โดยมี data มาสอน
Unsupervised Learning— เรียนรู้โดยไม่มี data มาสอน
Reinforcement Learning — เรียนรู้ตามสภาพแวดล้อม

การเรียนรู้แบบมีผู้สอน (Supervised Learning)

รูปแบบการเรียนรู้แบบมีผู้สอนโดยทั่วไป จะอยู่ในลักษณะการทำนายผลลัพธ์ เช่น จะทำนายว่าตัวอักษร
ในภาพคืออะไร หรือรายได้ที่ควรคาดหวังจากการลงทุนเป็นเท่าใด

“การมีผู้สอน” ในที่นี้หมายความว่า ในข้อมูลที่ใช้ฝึก (Training Data) เราจะมีมนุษย์มาคอยแยกประเภท
หรือบอกผลลัพธ์ (Label) ที่ควรจะเป็นไปไว้ด้วย จากนั้นเราจะนำข้อมูลที่ใช้ฝึก (ที่มี Label) ไปผ่าน
อัลกอริทึมสำหรับสร้างโมเดลที่ไว้ทำนายผลลัพธ์

เมื่อเราได้โมเดลที่ไว้ทำนายแล้ว เราจะนำข้อมูลใหม่ที่เครื่องไม่เคยเห็น กล่าวคือไม่ใช่ข้อมูลชุดเดียวกัน
กับข้อมูลฝึกหัด เครื่องจะต้องทำนาย (Predict) ว่าคำตอบที่ได้ควรจะเป็นอะไร

ภาพด้านบนคือ รูปแบบพื้นฐานของการเรียนรู้แบบมีผู้สอน

Labels เป็นส่วนที่ผู้สอนกำหนดให้ว่าจากข้อมูลที่ให้นั้นคำตอบที่ถูกคืออะไร
Predictive Model ผลจากการฝึกคือโมเดลที่ใช้ในการทำนายผลลัพธ์
New Data ข้อมูลที่เครื่องไม่เคยเห็น (ใส่เข้ามาตอนใช้งานจริง หรือตอนที่ต้องการวัดประสิทธิภาพ)
Prediction ผลที่เครื่องทำนายออกมา

ประเภทของการเรียนรู้แบบมีผู้สอนจะแยกออกเป็นสองประเภท

การแยกประเภท (Classification)
การถดถอยเชิงสถิติ (Statistical Regression)

การแยกประเภท Classification

ภาพใบหน้าคือข้อมูลฝึกหัด
ชื่อของบุคคลในภาพคือ Label
หากเรามีภาพใหม่ที่ไม่รู้ว่าเป็นใคร และส่งเข้ามาให้เครื่องทายอันนั้นคือ New Data
ผลการทายว่า เช่นทายภาพว่าเป็น Robert Downy Jr. เป็นการ Prediction

การถดถอยเชิงสถิติ (Statistical Regression)

การแยกประเภทเป็นหนึ่งในการเรียนรู้แบบมีผู้สอน และเป็นประเภทที่พบบ่อย เช่น การจดจำใบหน้าของคน เรามาลองดูว่าในการจดจำใบหน้าคนนั้นแต่ละส่วนในรูปแบบพื้นฐานประกอบด้วยอะไรบ้าง

คำว่า แยก“ประเภท” (Class) ในที่นี้ก็คือชื่อของคนนั้นเอง

แล้ว Label กับ Class เหมือนกันหรือไม่ ?

คำตอบคือ Label กับ Class ไม่ใช่อย่างเดียวกัน แต่มีความสัมพันธ์เชื่อมโยงกันอยู่ เรามายกตัวอย่างจากการจดจำใบหน้ากันดู

Label เป็นสิ่งที่เราระบุลงไปเพื่อการฝึกฝน เช่นหากเรามีรูปภาพคน 100,000 ภาพ เราจะต้อง Label ลงไปทั้ง 100,000 ภาพ

Class เป็นกลุ่มของชุดคำตอบที่เป็นไปได้ เช่น เรามี 100,00 ภาพก็จริง แต่ใน 100,00 ภาพนั้นเป็นภาพของคน 10 คน จะได้ว่า Class ของเรานั้นจะเท่ากับ 10

การถดถอยเชิงสถิติเป็นการหาความสัมพันธ์ระหว่างตัวแปร เช่น พื้นที่ของที่ดิน (x) กับราคาที่ดิน (y) โมเดลที่ใช้ในการหาความสัมพันธ์มีด้วยกันอยู่หลายแบบ แต่ที่นิยมกันคือการถดถอยเชิงเส้น (Linear Regression)

เราจะใส่ข้อมูลเป็น x และระบุค่า y ที่ควรจะเป็นจากนั้นเครื่องจะประมาณเส้นซึ่งจะสามารถประมาณค่าของ y จาก x ที่กำหนดได้ดีที่สุดที่สุด

การเรียนรู้แบบไม่มีผู้สอน (Unsupervised Learning)

ในการเรียนรู้แบบมีผู้สอนเราจะรู้ว่าคำตอบที่ควรจะเป็นคืออะไรและเราก็ระบุคำตอบที่ถูกต้องลงไปในฉลาก แต่ในการเรียนรู้แบบไม่มีผู้สอนเราจะรู้คำตอบที่แน่ชัด แต่ เราต้องการให้เครื่องตามหาโครงสร้างข้อมูลที่เราไม่รู้จัก (โครงสร้างที่ไม่รู้จัก)

การเรียนรู้แบบไม่มีผู้สอนแบ่งออกเป็น 2 ประเภท
-การจับกลุ่มของข้อมูล

-การลดจำนวนมิติเพื่อบีบอัดข้อมูล

การจับกลุ่มของข้อมูล (clustering)

ในบางที่เรามีข้อมูลจำนวนมากที่เราไม่สามารถจะใส่ป้ายได้ไหวเรารู้แต่ว่าข้อมูลของเรานั้นมากมายจำนวนชั้นเราอาจจะระบุให้เครื่องกระจายข้อมูลออกเป็นจำนวนชั้น ไม่ว่าจะเป็นอะไรก็ตามเราจะต้องระบุฉลากจำนวนมากจะลดลงเหลือเพียงแค่จำนวนชั้น

ภาพตัวอย่างการจับกลุ่มข้อมูลจากข้อมูลเข้าสองมิติ (ข้อมูลเข้าเป็นตัวเลขสองค่าคือ x1 และ x2) เราไม่รู้ว่าตัวไหนอยู่ในกลุ่มใด (จุดสีเทา) แต่เรากำาหนดให้เครื่องหาวิธีแบ่งกลุ่มข้อมูลออกเป็นสามกลุ่ม และ ได้ผลออกเป็นบริเวณขอบเขตของแต่ละกลุ่มภาพ

การลดจำนวนมิติเพื่อบีบอัดข้อมูล (Dimensionality Reduction)

การลดจำนวนมิติเพื่อบีบอัดข้อมูล เป็นกลไกที่ทำให้เราไม่จำเป็นต้องเก็บข้อมูลไว้ครบ แต่ก็ยังสามารถจำแนกข้อมูลได้ เช่นเรามีข้อมูลสามมิติของข้อมูลหลายๆคลาส สิ่งที่เราต้องการคือ การลดข้อมูลให้เหลือสองมิติและยังสามารถนำไปแยกประเภทคลาสได้ดีเท่าเดิม (อาจดีขึ้นเป็นไปได้)

การเรียนรู้แบบเสริมแรง (Reinforcement Learning)

หลายคนอาจเคยคิดอยากจะให้คอมพิวเตอร์เล่นเกมแทนเรา หรือที่เราเคยชินกับคำว่า “Bot” ถ้าเป็นเกมเก็บเลเวลแบบปกติ เราอาจจะเขียนโปรแกรมให้มันดำเนินตามกฏอะไรบางอย่างไปเรื่อยๆ แต่ถ้าเป็นเกมอย่าง Mario ล่ะ

เราอาจจะใช้โมเดลการให้รางวัลเมื่อบอทเราสามารถทำแต้มได้ดี และให้มันคอยสังเกตว่าการทำ Action แต่ละอย่างแล้วจะได้คะแนนสุดท้ายออกมาเป็นเท่าไร

ถ้าเราทำ Action ตามลำดับต่างๆ ออกมาแล้วคะแนนดี เราก็จะได้รางวัล (Reward) เครื่องจะเริ่มจดจำลำดับการทำ Action แล้วได้คะแนนดี และพยายามจะทำ Action นั้นเรื่อยๆ การที่มันได้รางวัลเท่ากับเป็นการสนับสนุนให้โปรแกรมทำ Action นั้นซ้ำๆ ยิ่ง Action นั้นได้รางวัลมาก ก็จะทำแบบนั้นบ่อยๆ สิ่งที่สำคัญคือ เราต้องคิดโมเดลการให้คะแนนที่ดี

แหล่งที่มา

https://medium.com/convolab/machine-learning-basics-2b38700cb10b

https://blog.finnomena.com/machine-learning

เรื่องนี้บอกอะไรกับนักเรียน

เรื่องนี้ทำให้เราได้ทราบเกี่ยวกับการพัฒานาการทางเทคโนโลยีของ machine learning ที่มีมาอย่างต่อเนื่องตั้งแต่ ค.ศ.1950 และยังทำให้เราเข้าใจเกี่ยวกับหลักการทำงานและประโยชน์ในด้านต่างๆของ machine leaning เพื่อจะได้นำไปใช้ประโยชน์ในการต่อยอดสิ่งต่างๆได้อย่างถูกต้องแม่นยำมากขึ้น

ประโยชน์ที่ได้จากเรื่องนี้

ตัวอย่างประโยชน์ของ machine leaning

การศึกษางานชิ้นหนึ่ง ด้วยการวินิจฉัยโดยใช้คอมพิวเตอร์ช่วย (computer assisted diagnosis, CAD) เพื่อตรวจสอบสแกนหามะเร็งเต้านมของผู้หญิงในระยะแรกและมะเร็งเต้านมในระยะต่อมา และคอมพิวเตอร์ตรวจพบ 52% ของมะเร็ง ซึ่งเป็นจำนวนที่เท่ากับปีก่อนที่ผู้หญิงคนนี้จะถูกวินัจฉัยว่าเป็นมะเร็ง นอกจากนี้ Machine Learning สามารถใช้ทำความเข้าใจถึงปัจจัยเสี่ยงของโรคในประชากรกลุ่มใหญ่ๆได้ บริษัท Medecision พัฒนาอัลกอริทึมที่สามารถระบุตัวแปร 8 ปัจจัย เพื่อคาดการณ์แนวทางการรักษาที่สามารถหลีกเลี่ยงความเสี่ยงในการเกิดโรคได้ในผู้ป่วยโรคเบาหวาน

คุณอาจเคยช็อปปิ้งออนไลน์และมีโอกาสเข้าชมร้านค้าออนไลน์และมองหาสินค้าสักชิ้นหนึ่ง แต่ไม่ได้ซื้อเลย แล้วคุณกลับพบเห็นโฆษณาดิจิทัลบนเว็บสำหรับสินค้านั้นชิ้นเดียวกับที่คุณเคยเข้าไปดูก่อนหน้านี้ การตลาด ลักษณะนี้เป็นเพียงสิ่งเล็กๆของความสามารถในการทำการตลาดออนไลน์ในสมัยนี้ได้ บริษัทผู้ทำการตลาดออนไลน์สามารถกำหนดอีเมล์ส่วนตัวและลูกค้า เพื่อส่งอีเมล์หรือคูปองให้โดยตรง ซึ่งเสนอ “สินค้าแนะนำ” ให้ลูกค้าเห็น และทั้งหมดนั้นออกแบบมาเพื่อนำเสนอขายสินค้าต่อผู้บริโภคที่น่าเชื่อถือได้นั่นเอง

การประมวลภาษาธรรมชาติ (Natural Language Processing, NLP) กำลังถูกนำมาใช้ในทุกประเภทของการใช้งานที่น่าตื่นเต้นข้ามวงการ อัลกอริทึมของ Machine Learning ด้วยการใช้์NPL สามามารถทำหน้าที่บริการลูกค้าและนำเสนอข้อมูลที่ลูกค้าต้องการได้อย่างรวดเร็วทันใจ และยังถูกนำมาใช้แปลภาษากฎหมายที่กำกวมในสัญญาให้เป็นภาษาที่เข้าใจง่ายๆ และช่วยให้ทนายความจำแนกข้อมูลจำนวนมากเพื่อเตรียมพร้อมสำหรับแต่ละกรณี

เมื่อเร็วๆนี้บริษัท IBM ได้ทำการสำรวจผู้บริหารระดับสูงด้านรถยนต์ และจำนวน 74% คาดการณ์ว่าพวกเราจะได้เห็นรถสมาร์ทคาร์ (Smart Car) แล่นบนถนนในปี 2025 รถสมาร์ทคาร์ไม่เพียงแต่ผสานเข้ากับ Internet of things (IoT) แต่ยังเรียนรู้เกี่ยวกับเจ้าของรถและสภาพแวดล้อม อาจปรับการตั้งค่าภายใน เช่น อุณหภูมิ เสียง ตำแหน่งที่นั่ง เป็นต้น ปรับตัวเองโดยอัตโนมัติบนพื้นฐานของคนขับ รายงาน และแม้กระทั่งแก้ไขปัญหาเอง ขับเองได้ และแนะนำสภาพการจราจรและถนนตามเวลาจริง ณ เวลานั้น ได้

นักเรียนนำสิ่งที่ได้จากเรื่องนี้มาใช้อย่างไร

-นำมาใช้ในการเลือกซื้อสินค้าในอินเตอร์เน็ต และยังสามารถเห็นสินค้าที่มีความคล้ายคลึงหรือเป็นประเภทเดียวกันกับที่ต้องการได้จากโฆษณาที่ขึ้นมาอีกด้วย

-ใช้ในการเสิร์ชหาข้อมูลต่างๆได้อย่างรวดเร็ว แม่นยำมากขึ้น

-สามารถใช้ฟังเสียงเรา เข้าใจเรา และโต้ตอบกับเรา ทางผู้ช่วยเสมือน (Virtual Assistant) ที่อยู่กับเราตลอดเวลาไม่ว่าจะเป็น Siri, Cortana เป็นต้น

TECHNOLOGY_YANISA

อ่านคิดวิเคราะห์และเขียนสื่อความ

เรื่องนี้บอกอะไรกับนักเรียน

ประโยชน์ที่ได้จากเรื่องนี้

นักเรียนนำสิ่งที่ได้จากเรื่องนี้มาใช้อย่างไร

ไม่มีความคิดเห็น:

แสดงความคิดเห็น

เที่ยวบ้านหอมเทียนที่เมืองโอ่ง

รายงานการละเมิด