01 ภาพรวมงานวิจัย
MIT Media Lab วัด EEG คนเขียน essay 54 คน 4 เดือน เพื่อดูว่าสมองทำงานยังไงเวลาใช้ ChatGPT / Google / ไม่ใช้อะไรเลย
คลิกเพื่อดูกฎของแต่ละกลุ่ม
18 คน — ไม่ใช้เครื่องมือใดเลย ต้องคิดและเขียนเองล้วนๆ ในเวลา 20 นาที
- ห้ามใช้ ChatGPT / Claude / LLM ใดๆ
- ห้ามเปิดเว็บไซต์ / Google / Wikipedia
- ใช้ความรู้และความคิดของตัวเองเท่านั้น
- เขียนใน text editor ธรรมดา
18 คน — ใช้ Google ค้นข้อมูลได้ แต่ห้ามแตะ AI
- เปิดเว็บไซต์ใดก็ได้ (Google เป็น browser หลัก)
- ห้ามใช้ ChatGPT / Claude / LLM ใดๆ
- นักวิจัยใส่
-aiใน query เพื่อปิด Google AI Overview - เห็นได้ทั้ง search result list และเข้าเว็บไหนก็ได้
18 คน — ใช้ ChatGPT เท่านั้น ไม่มีเครื่องมืออื่น
- ใช้ ChatGPT ของ OpenAI ได้เต็มที่
- ห้ามเปิด browser / Google / website อื่น
- ห้ามใช้ LLM อื่น (Claude, Gemini, ฯลฯ)
- ก๊อปวาง / แก้ไข / re-prompt ได้ตามต้องการ
02 ศัพท์ที่ต้องรู้ก่อน
งานวิจัยใช้คำเฉพาะทางหลายคำ — ก่อนดูผลลัพธ์ มาเข้าใจคำเหล่านี้กันก่อน
EEG (Electroencephalography)
Alpha / Beta / Theta / Delta Bands
Delta (0.5-4 Hz): สมองตอนหลับลึก, การประมวลผลใต้สำนึก
Theta (4-8 Hz): การจำ การเรียนรู้ semantic encoding
Alpha (8-12 Hz): สมาธิแบบสงบ การ relax, integration
Beta (12-30 Hz): สมาธิแบบ active ใช้คิด แก้ปัญหา
ในงานวิจัยนี้: theta + alpha = ตัวสำคัญที่บอกว่าสมองกำลังจดจำเนื้อหา
dDTF (Dynamic Directed Transfer Function)
งานวิจัยใช้ dDTF เพื่อเทียบว่ากลุ่มไหนสมองทำงานเป็นทีมแน่นกว่ากัน — และพบว่า กลุ่ม LLM มีค่า dDTF ต่ำสุด 55% เทียบกับกลุ่ม Brain-only
NER (Named Entity Recognition)
นักวิจัยใช้โมเดล
llama4:17b-scout-16e สแกน essay ทุกฉบับ แล้วเอามาเทียบกัน — เพื่อดูว่าแต่ละกลุ่มอ้างชื่อใครบ้าง
Search group ชอบใช้: Madonna, Golden Rule, homo sapiens — ชื่อที่ขึ้น search result
Brain-only ชอบใช้: Instagram, ชื่อที่หลากหลาย กระจายตัว — มาจากชีวิตจริง
N-grams
ใช้เพื่อหาว่าแต่ละกลุ่มชอบใช้วลีอะไรซ้ำๆ — และ วลีนั้นมาจากไหน (จาก search optimization? จาก ChatGPT training? หรือจากความคิดเอง?)
Search group ใช้ "homeless person" บ่อยมาก — เพราะ Google bid price + monthly search ของคำ "homeless" สูง (โฆษณาทุ่มไปทางนี้)
LLM group ใช้ "giving" บ่อยมาก — เพราะ ChatGPT training data เลี่ยงคำ "homeless"
Brain-only เขียนถึง freedom และ liberty มากกว่า — ไม่ติด pattern ของเครื่องมือเลย
นี่คือหลักฐานว่า เครื่องมือไม่ใช่กลาง — มันชี้นำความคิดของเราโดยไม่รู้ตัว
Ontology
นักวิจัยใช้ AI agent สร้าง ontology graph สำหรับ essay แต่ละฉบับ — นับว่ามีกี่ "edges" (เส้นเชื่อมแนวคิด) แล้วเทียบระหว่างกลุ่ม
ผล: กลุ่ม LLM ใช้ ontology ที่เหมือนกันมาก (homogenous) — เพราะ ChatGPT คิดให้ตามแม่แบบเดียวกันหมด
กลุ่ม Brain-only มี ontology หลากหลายที่สุด เพราะแต่ละคนคิดต่างกันจริงๆ
Ownership / Cognitive Agency
Brain-only: 16-17 จาก 18 คน รู้สึกว่าเรียงความเป็นของตัวเอง 100%
LLM: กระจาย — บางคน 100%, บางคนปฏิเสธว่าไม่ใช่ของตัวเองเลย, ส่วนใหญ่บอก 50-90%
นักวิจัยเรียกอาการนี้ว่า "psychological dissociation from the written output" — เขียนเอง แต่รู้สึกว่าไม่ใช่ของเรา
Cognitive Debt
เปรียบเหมือนหนี้บัตรเครดิต: ใช้ AI ช่วยทำงานเลย ตอนนี้ดูเหมือนจะได้ผลเร็ว แต่สมองข้าม process ที่จำเป็นต่อการเรียนรู้ → ผลเสียมาตามทีหลังเป็นการลดความสามารถจำ-ตีความเอง
ไม่ใช่ "สมองพัง" หรือ "brain rot" — มันคือ "ขาด practice ในการประมวลผลเอง"
03 ใครเข้าร่วมงานวิจัย
การออกแบบและการคัดเลือก participant — นักวิจัยใช้ Boston-area university students และจ่ายเงินค่าตอบแทน
การคัดเลือก
Demographics
5 มหาวิทยาลัยใน greater Boston area
การจ่ายค่าตอบแทน + จริยธรรม
- ผู้เข้าร่วมแต่ละคนได้ $100 เป็น check หลังจบ 3 sessions
- เพิ่มอีก $50 ถ้ามาทำ session 4 ด้วย
- ผ่านการอนุมัติจาก IRB ของ MIT (ID 21070000428)
- การจัดกลุ่มเป็นแบบ random + balanced ตามอายุและเพศ
- มี pilot study กับ 3 คนก่อนเริ่มจริง เพื่อ test pipeline
04 ทำการทดลองยังไง — Step by Step
แต่ละ session กินเวลาประมาณ 70+ นาที — 6 stages ตามลำดับ คลิกแต่ละ stage เพื่อดูรายละเอียด
ปิดมือถือ smartwatch ทุกอย่าง เก็บใส่กล่อง เพื่อไม่รบกวนสัญญาณ EEG
• 2 นาที — คิดเลขในใจ (เช่น 128 × 56)
• 2 นาที — resting นั่งเฉยๆ ไม่คิดอะไร
• 2 นาที — กระพริบตา กลอกตาซ้ายขวา ขึ้นลง
ใช้ baseline นี้เทียบกับสัญญาณตอนเขียน essay
9 หัวข้อรวมตลอด 3 sessions: LOYALTY, HAPPINESS, ART, FORETHOUGHT, PERFECT, CHOICES, PHILANTHROPY, และอื่นๆ
Session 4 — เลือกหัวข้อที่เคยเขียนแล้ว แต่ใช้เครื่องมือ ตรงข้าม กับที่เคยใช้
1. ทำไมเลือกหัวข้อนี้?
2. ตามโครงสร้าง essay มาตรฐานไหม?
3. quote ของตัวเองได้ไหม?
4. quote ถูกต้องไหม?
5. รู้สึกว่า essay เป็นของตัวเองกี่ %?
6. พอใจกับสิ่งที่เขียนไหม?
05 วัดผลด้วยอะไรบ้าง — 4 มุมขนานกัน
essay ที่เขียนแต่ละชิ้นถูกประเมินจาก 4 มุมพร้อมกัน — เพื่อ cross-check ผลและเห็นภาพรอบด้าน
1. EEG Analysis
วัด dDTF ทั้ง alpha/beta/theta/delta bands — สมองส่วนไหนคุยกับส่วนไหน connectivity เป็นกราฟ directed network
2. NLP Analysis
NER + n-grams + ontology + latent space embeddings — วิเคราะห์ภาษาของ essay เพื่อดูว่าแต่ละกลุ่มใช้คำต่างกันยังไง
3. Human Teachers
ครูที่ คุ้นเคยกับ essay ที่ AI ช่วยอยู่แล้ว ในงานประจำ — ดู structure, originality, content quality (ไม่รู้ว่า essay มาจากกลุ่มไหน)
4. AI Judge
AI agent ที่ multi-shot fine-tuned สำหรับ scoring โดยเฉพาะ — เทียบกับ human teachers เพื่อดู bias
ผลที่น่าสนใจของการประเมิน
Human teachers จับ LLM essays ได้ — เห็น pattern ว่าโครงสร้างซ้ำกัน แม้ไม่บอกว่ามาจากกลุ่มไหน ครูยังจำได้แต่ละคน "เขียนสไตล์ตัวเองยังไง" จาก work experience ที่ embed อยู่ในงาน
AI Judge ตรงข้าม — ให้คะแนน LLM essays สูงกว่าครู โดยเฉพาะเรื่อง uniqueness แม้ multi-shot fine-tune แล้ว AI ก็ยังจำสไตล์รายบุคคลไม่ได้
นี่คือหลักฐานว่า AI-grading systems จะ inflate AI-generated work เป็นวงจรปิดที่อันตรายของระบบการศึกษา
AI Judge ให้คะแนนสูง · ครูจริงให้คะแนนต่ำ — essay ชุดเดียวกันเป๊ะ
06 สมอง 3 กลุ่มต่างกันยังไง?
คลิกสลับกลุ่มเพื่อดู — connections จะ animate วาดตามลำดับเพื่อให้เห็นภาพชัด
กลุ่ม Brain-only
เส้นหนา = ค่า dDTF สูง · เส้นบาง = ค่า dDTF ต่ำ · ไม่มีเส้น = ไม่ significant
07 ผลลัพธ์
3 ผลลัพธ์หลักจากงานวิจัย — Quoting, Ownership, Brain Connectivity
การ quote ของตัวเองข้าม 3 sessions — ปัญหามันไม่ได้หายไป
08 ตัวอย่าง: หัวข้อ PHILANTHROPY
นี่คือหลักฐานที่ชัดที่สุดว่า เครื่องมือไม่ใช่ตัวกลาง — มัน ชี้นำ ความคิดของเราโดยไม่รู้ตัว
3 กลุ่มเขียน essay เกี่ยวกับ "การกุศล" หัวข้อเดียวกัน — แต่ใช้คำต่างกันชัดเจน:
Brain-only
Search Engine
homeless มี monthly search สูงกว่า 900% และ Google bid price สูง (Ads ดึงเข้ามา)LLM (ChatGPT)
ทำไมเรื่องนี้สำคัญ?
เราทุกคนมี bias — แต่ มาจากแหล่งต่างกัน และผลกระทบก็ต่างกัน เครื่องมือแต่ละตัว ชี้นำ ความคิดของเราโดยที่เราไม่รู้ตัว
Bias จาก ads + SEO
ใครจ่าย Google มากกว่า ความคิดของคนนั้นได้พื้นที่บน screen — "homeless" มี monthly search สูงกว่า 900% และ bid price สูง
Bias จาก training data
ใครเลือก dataset ที่ train คนนั้นเลือกความคิดให้เรา — และยังมี safety filter ที่หลบคำบางคำ เลยไป-bias ไปทาง alternative
Bias จากประสบการณ์ตัวเอง
ทุกคนยังมี bias — แต่มาจากชีวิต ประสบการณ์ และความคิดของเราเอง เป็น bias ที่ "เป็นเจ้าของได้"
Search bias = paid by advertisers · LLM bias = chosen by AI labs · Brain-only bias = lived by you
วิธีใช้ AI ที่ดีคือ คิดเองก่อน ให้ bias ของเราเองทำงาน แล้วค่อยใช้ AI ขยาย — ไม่ใช่ใช้ AI สร้างความคิดให้เรา
09 Session 4 — จุดพลิก
ใน session ที่ 4 นักวิจัยสลับเครื่องมือกัน ผลที่ออกมาคือ กระจกสะท้อนตรงข้าม
LLM → Brain
สมอง ไม่มี high-significance connectivity clusters (p < 0.001) — แสดงว่าการเรียนรู้แบบ deep encoding ขาดหายไป
Brain → LLM
สมอง สูงขึ้น ในทุกย่านความถี่ — สูงกว่ากลุ่ม LLM ที่ใช้ AI มาตั้งแต่ Session 1!
เลขกระจกสะท้อน
เลขกลับกันเป๊ะ — 78/11 ↔ 11/78 ไม่ใช่ coincidence แต่คือหลักฐานชัดเจนว่าลำดับการใช้ AI สำคัญต่อสมอง
10 ใช้ AI ยังไงให้สมองได้ประโยชน์
นี่ไม่ใช่คำแนะนำของผม — นักวิจัย MIT เขียนไว้ใน Discussion ของ paper เอง
The Sequence
ลำดับสำคัญกว่าเครื่องมือ — Brain-first-then-AI = ดีที่สุด
คิด/เขียนเองก่อน
อ่านโจทย์ ตั้งคำถามเอง สรุปด้วยคำของตัวเอง อย่าเปิด AI ทันที
ค่อยใช้ AI เสริม
หลัง engage กับเนื้อหาแล้ว ค่อยให้ AI ช่วยขยาย ตรวจ challenge ความคิด
compile กลับเป็นของตัวเอง
สรุปสิ่งที่ได้กลับมาเป็น note ของตัวเอง — เก็บไว้ใช้ในอนาคต (LLM Wiki pattern)
เครื่องมือเสริมเข้ากับแต่ละ step
1อ่าน paper ด้วยตัวเองก่อน
ใช้ UPDF เปิด PDF → highlight ส่วนที่สนใจ → จดคำถามของตัวเองใน annotation ก่อนใช้ AI
2ค่อยถาม AI
ใช้ UPDF AI Chat ถามคำถามที่คิดไว้ — ตรวจคำตอบกับเนื้อหา ไม่ใช่ก๊อปลงสมุดเลย
3เก็บเป็น Second Brain
สรุปกลับเข้า LLM Wiki / Obsidian ของตัวเอง — สมองได้ทบทวน + มี record ไว้ใช้ในอนาคต
⚠เครื่องมือไม่ใช่คำตอบ
MIT lab เดียวกันสร้าง NeuroChat ที่อ่าน EEG real-time — engagement สูงขึ้น แต่ learning ไม่ดีขึ้น ลำดับการใช้ > ตัวเครื่องมือ
11 ข้อจำกัด (นักวิจัยบอกเอง)
paper นี้ไม่ใช่ final word — นักวิจัยเขียน Limitations ไว้ชัดเจนว่าผลยัง generalize ไม่ได้
12 ค่าพลังงาน (Bonus)
ค่า cognitive ไม่ใช่ค่าเดียวที่ LLM ใช้ — ค่าไฟด้วย
| เครื่องมือ | Energy ต่อ query | 20 ชม. การใช้ | เทียบ |
|---|---|---|---|
| LLM (ChatGPT) | 0.3 Wh | 180 Wh | 10× |
| Search Engine (Google) | 0.03 Wh | 18 Wh | 1× (baseline) |
นักวิจัยฝากไว้ใน Limitations section ว่า — ค่าไฟพวกนี้สุดท้ายก็ตกอยู่กับผู้ใช้ในที่สุด