Trusted Research Environment (TRE) คืออะไร?
เมื่อนึกถึงการหาข้อมูลในการทำวิจัยทางด้านวิทยาศาสตร์ข้อมูลระดับประเทศ จะนึกถึงอะไรเป็นอันดับแรก?
Open Data? Open API?
ตัวเลือกเหล่านี้คงเป็นตัวเลือกแรกๆที่หลายคนนึกถึง ข้อมูลเหล่านี้สามารถถูกเปิดเผยและนำมาใช้อย่างกว้างขวางเพื่อประโยชน์ของการพัฒนาองค์ความรู้ในด้านต่างๆและการหามุมมองใหม่ๆเพื่อสร้างคุณค่าในอนาคต
แต่ถ้าหากข้อมูลที่เราต้องการจะนำมาใช้ในการวิจัย คือข้อมูลทางการแพทย์ล่ะ?
เพียงแค่มีคำว่า ‘การแพทย์’ แทรกเข้ามาทุกอย่างก็ฟังดูเป็นเรื่องน่ายุ่งยากขึ้นมาทันที
เพราะว่าข้อมูลเหล่านั้นเป็นข้อมูลที่สำคัญและต้องคำนึงถึงความปลอดภัยของเจ้าของข้อมูลเป็นอย่างมาก ไม่เพียงเท่านั้น การทำDigital Transformationในตัวฝั่งของโรงพยาบาลเองก็ยังอยู่ในกระบวนการพัฒนา การที่จะรวบรวมข้อมูลในระดับภูมิภาคหรือระดับประเทศเพื่อนำข้อมูลรักษาเชิงลึกของประชาชนไปใช้ในการวิจัยจึงนับเป็นภารกิจที่ท้าทายอย่างมาก ยังไม่ต้องพูดถึงปัญหา Data silos ที่อาจรอคอยอยู่ ณ ปลายทางอย่างข้อมูลที่ไม่เชื่อมต่อกันระหว่างโรงพยาบาลจากข้อจำกัดในเชิงการรักษาข้อมูลส่วนบุคคล เช่นในโซนทวีปตะวันตก ก็จะมี General Data Protection Regulation (GDPR) และ Health Insurance Portability and Accountability Act (HIPAA) ที่คอยคุมอยู่
อย่างไรก็ตามการรวบรวมและเผยแพร่ข้อมูลให้กลุ่มนักวิจัยที่ได้รับอนุญาติสามารถเข้าถึงได้ก็เป็นเรื่องที่ไม่อาจมองข้าม โดยเฉพาะเมื่อมาถึงโจทย์การพัฒนาองค์ความรู้ในการตรวจจับ ป้องกันและรักษาโรคอย่างมีประสิทธิภาพ ไปจนถึงการขับเคลื่อนนโยบายที่เหมาะสมทางสาธารณสุขในระดับประเทศ
แต่ก่อนจะไปไกลถึงข้อมูลเชิงลึกอย่างผลตรวจเลือด ภาพถ่ายX-Rayหรือผลการเก็บข้อมูลร่างกายส่วนอื่นๆ เรามาพูดถึงแค่ในส่วนของข้อมูลที่เรามีอยู่ในปัจจุบันกันก่อน
เมื่อเจาะจงว่าต้องเป็นข้อมูลของประชากรคนไทย ตัวเลือกแรกๆที่ผู้คนจะวิ่งเข้าหาก็อาจจะเป็นกระทรวงสาธารณสุข DGA หรือตัวโรงพยาบาลเอง ซึ่งกว่าจะได้ข้อมูลทีละส่วนมานั้นต้องผ่านกระบวนการที่ลึกลับซับซ้อนหลายขั้นตอน หรือแม้กระทั่งผลการทำวิจัยในห้องแลปเองก็ยากที่จะหาเส้นทางส่งต่อข้อมูลกลับคืนสู่Communityอย่างเป็นระบบ
จนกลายท้ายที่สุดเป็นว่าขั้นตอนการขอข้อมูลกลายมาเป็นอุปสรรค์ที่ขัดขวางการทำวิจัยที่นักวิจัยควรจะมีสิทธิ์และโอกาสในการเข้าถึงข้อมูลที่ครบถ้วนครอบคลุมอย่างเท่าเทียม ตรวจสอบได้ มีประสิทธิภาพและปลอดภัย การที่จะทำให้สิ่งที่เรียกว่า Data-driven research ระดับประเทศเกิดขึ้นอย่างยั่งยืนนั้นจึงเป็นเรื่องยากจนหลายคนเลือกที่จะมองข้าม
บทความนี้จึงจะพาทุกท่านไปสำรวจโมเดลของ National Health Service แห่งสหราชอาณาจักร ถึงการจัดวาง Infrastructure ทางด้านการเข้าถึงข้อมูลเพื่อเอื้อประโยชน์ให้แก่ฝ่ายทุกฝ่าย ทั้งนักวิจัย ประชาชนและตัวภาครัฐเอง
*อนึ่ง โมเดลของ TRE และ SDE ยังอยู่ในกระบวนการทดลองใช้ การนำโมเดลไปใช้งานย่อมต้องคำนึงถึงปัจจัยอื่นๆของแต่ละประเทศด้วย
เมื่อพิจารณาถึงในแง่ผู้ใช้งาน องค์ประกอบที่สำคัญของผู้ใช้ข้อมูลเชิงการแพทย์มีทั้งหมด 3 องค์ประกอบหลัก
- ภาครัฐและโรงพยาบาล
- ภาคงานวิจัยและนวัตกรรม
- ภาคการศึกษา
แต่ละภาคส่วนล้วนมีความต้องการที่จะเข้าถึงข้อมูลเพื่อวิเคราะห์และวิจัย แต่กลับพบว่าการเก็บข้อมูลแบบแยกส่วนกันส่วนมากจะไม่มีมาตรฐานร่วมกันใดๆ ทำให้การที่แต่ละภาคส่วนจะสามารถเข้าถึงข้อมูลแบบข้ามไปมากันได้ ก็มักจะติดข้อจำกัดในเชิงกระบวนการการขอข้อมูลต่างๆมากมาย หรือเมื่อทำเรื่องการขอข้อมูลสำเร็จ ข้อมูลจะหลุดออกมาจากต้นทางและถูกคัดลอกออกมาสู่ฝั่งของผู้ขอข้อมูล ซึ่งอาจนำไปสู่ความเสี่ยงในเชิงการรักษาข้อมูลในอนาคต
แต่หากข้อมูลไม่ได้ถูกคัดลอกหรือปล่อยออกมาจากทางต้นทางตั้งแต่แรกล่ะ?
ถ้าหากว่านักวิจัยสามารถเข้าถึงข้อมูลบนInfrastructureของต้นทางแต่ยังสามารถExportผลลัพท์จากการวิเคราะห์ข้อมูลได้อยู่?
Trusted Research Environment (TRE)
Trusted Research Environment (TRE) เป็นServiceที่ถูกสร้างขึ้นมาเพื่อเป็นData Platformให้แก่นักวิจัยเข้าถึงข้อมูลทางด้านสาธารณสุข ภายในServiceนี้จะถูกติดตั้งให้กับผู้ถือครองข้อมูลหรือต้นทางของข้อมูล พร้อมกับมีเครื่องมือวิเคราะห์ทางสถิติเพื่อช่วยเหลือนักวิจัยในการเข้าถึงข้อมูลและทำวิจัยอย่างมีประสิทธิภาพมากที่สุด โดยที่นักวิจัยจะสามารถเข้าถึงข้อมูลเพียงในส่วนที่ได้รับอนุญาติเท่านั้น
Secure data environments (SDE) นับเป็นส่วนหนึ่งของ TRE (trusted research environments) สิ่งนี้เป็นเหมือน Virtual environment ที่อนุญาติให้ผู้ใช้งานสามารถเข้าถึงข้อมูลเพื่อทำการวิเคราะห์บนแพลตฟอร์มได้โดยตรงโดยไม่ต้องกระจายหรือเคลื่อนย้ายข้อมูลไปยังฝั่งของผู้ใช้งาน ดังนั้น SDE จึงเป็นแพลตฟอร์มที่ไม่เปิดให้ผู้ใช้งานดาวน์โหลดข้อมูลของข้อมูลดิบหรือRaw data แต่เปิดให้สามารถดาวน์โหลดข้อมูลที่ผ่านการวิเคราะห์มาแล้วเท่านั้น
ทุกการเข้าถึงข้อมูลของนักวิจัยใน Virtual environment ของ SDE จะถูกบันทึกและควบคุม การเปิดเผยและกระจายข้อมูลดิบทุกอย่างจากในแลปวิจัยสู่สาธารณะจึงไม่จำเป็นอีกต่อไป อีกทั้งข้อมูลส่วนตัวของเจ้าของข้อมูลจะไม่สามารถหลุดจากServerออกสู่ภายนอกได้เพราะการมีอยู่ของระบบประเมิน Monitoring และการบันทึกประวัติการดาวน์โหลดข้อมูลของตัวแพลตฟอร์มเอง
ทั้งนี้ ข้อจำกัดในเชิงInfrastructureอาจจะมีอยู่บ้าง หากInfrastructureของต้นทางตั้งอยู่บนCloud การคิดค่าใช้จ่ายตามการใช้งานแต่ละกลุ่มSDEน่าจะทำได้อย่างเป็นระบบและตรวจสอบได้ แต่ในกรณีที่เป็น On-prem การคิดค่าใช้จ่ายในเชิงResourceอาจจะค่อนข้างยุ่งยากเล็กน้อย (หากมีข้อมูลเพิ่มเติมในส่วนนี้จะมาอัพเดต)
หลักการที่TRE&SDEถูกสร้างมาเพื่อรักษาไว้ คือหลักการที่เรียกว่า 5 Safes อันประกอบด้วย
- Safe people
- Safe projects
- Safe settings
- Safe data
- Safe outputs
เรามาดูกันว่า Infrastructure แบบนี้จะตอบโจทย์หลัก 5 Safes ได้อย่างไรจากแผนภาพดังกล่าว
Safe setting: TRE ถูกติดตั้งอยู่ในData centreของต้นทางข้อมูล (เช่น รพ.หรือสาธารณสุข)
Safe People: มีแค่นักวิจัยที่ได้รับอนุญาติ จึงจะสามารถเข้าถึงInterfaceของข้อมูลได้
Safe Data: สามารถเข้าถึงแค่ข้อมูลที่ผ่านกระบวนการ ETL และถูกลบข้อมูลส่วนบุคคลออกไปแล้ว
Safe Projects: ข้อมูลโดยสังเขปของตัวProjectสามารถตรวจสอบได้และเผยแพร่ให้ผู้เข้าร่วมProject เพื่อให้เกิดความโปร่งใส
Safe output: ข้อมูลที่ Export สู่สาธารณะได้มีเพียงข้อมูลผลสรุปที่ผ่านการรีวิวแล้วเท่านั้น
หวังว่าข้อมูลและตัวอย่างการใช้งานดังกล่าวจะเป็นประโยชน์ต่อผู้อยากจะหยิบแนวความคิดนี้ไปปรับใช้และสร้างคุณประโยชน์ให้วงการแพทย์และงานวิจัยในอนาคต
Resource:
Trusted Research Environment service for England — NHS Digital
Trusted Research Environments (TREs) — A Guide for Beginners — CF (carnallfarrar.com)