Trusted Research Environment (TRE) คืออะไร?

Ming Yanisa
2 min readMar 2, 2023

--

เมื่อนึกถึงการหาข้อมูลในการทำวิจัยทางด้านวิทยาศาสตร์ข้อมูลระดับประเทศ จะนึกถึงอะไรเป็นอันดับแรก?

Open Data? Open API?

ตัวเลือกเหล่านี้คงเป็นตัวเลือกแรกๆที่หลายคนนึกถึง ข้อมูลเหล่านี้สามารถถูกเปิดเผยและนำมาใช้อย่างกว้างขวางเพื่อประโยชน์ของการพัฒนาองค์ความรู้ในด้านต่างๆและการหามุมมองใหม่ๆเพื่อสร้างคุณค่าในอนาคต

แต่ถ้าหากข้อมูลที่เราต้องการจะนำมาใช้ในการวิจัย คือข้อมูลทางการแพทย์ล่ะ?

เพียงแค่มีคำว่า ‘การแพทย์’ แทรกเข้ามาทุกอย่างก็ฟังดูเป็นเรื่องน่ายุ่งยากขึ้นมาทันที

เพราะว่าข้อมูลเหล่านั้นเป็นข้อมูลที่สำคัญและต้องคำนึงถึงความปลอดภัยของเจ้าของข้อมูลเป็นอย่างมาก ไม่เพียงเท่านั้น การทำDigital Transformationในตัวฝั่งของโรงพยาบาลเองก็ยังอยู่ในกระบวนการพัฒนา การที่จะรวบรวมข้อมูลในระดับภูมิภาคหรือระดับประเทศเพื่อนำข้อมูลรักษาเชิงลึกของประชาชนไปใช้ในการวิจัยจึงนับเป็นภารกิจที่ท้าทายอย่างมาก ยังไม่ต้องพูดถึงปัญหา Data silos ที่อาจรอคอยอยู่​ ณ ปลายทางอย่างข้อมูลที่ไม่เชื่อมต่อกันระหว่างโรงพยาบาลจากข้อจำกัดในเชิงการรักษาข้อมูลส่วนบุคคล เช่นในโซนทวีปตะวันตก ก็จะมี General Data Protection Regulation (GDPR) และ Health Insurance Portability and Accountability Act (HIPAA) ที่คอยคุมอยู่

อย่างไรก็ตามการรวบรวมและเผยแพร่ข้อมูลให้กลุ่มนักวิจัยที่ได้รับอนุญาติสามารถเข้าถึงได้ก็เป็นเรื่องที่ไม่อาจมองข้าม โดยเฉพาะเมื่อมาถึงโจทย์การพัฒนาองค์ความรู้ในการตรวจจับ ป้องกันและรักษาโรคอย่างมีประสิทธิภาพ ไปจนถึงการขับเคลื่อนนโยบายที่เหมาะสมทางสาธารณสุขในระดับประเทศ

แต่ก่อนจะไปไกลถึงข้อมูลเชิงลึกอย่างผลตรวจเลือด ภาพถ่ายX-Rayหรือผลการเก็บข้อมูลร่างกายส่วนอื่นๆ เรามาพูดถึงแค่ในส่วนของข้อมูลที่เรามีอยู่ในปัจจุบันกันก่อน

เมื่อเจาะจงว่าต้องเป็นข้อมูลของประชากรคนไทย ตัวเลือกแรกๆที่ผู้คนจะวิ่งเข้าหาก็อาจจะเป็นกระทรวงสาธารณสุข DGA หรือตัวโรงพยาบาลเอง ซึ่งกว่าจะได้ข้อมูลทีละส่วนมานั้นต้องผ่านกระบวนการที่ลึกลับซับซ้อนหลายขั้นตอน หรือแม้กระทั่งผลการทำวิจัยในห้องแลปเองก็ยากที่จะหาเส้นทางส่งต่อข้อมูลกลับคืนสู่Communityอย่างเป็นระบบ

จนกลายท้ายที่สุดเป็นว่าขั้นตอนการขอข้อมูลกลายมาเป็นอุปสรรค์ที่ขัดขวางการทำวิจัยที่นักวิจัยควรจะมีสิทธิ์และโอกาสในการเข้าถึงข้อมูลที่ครบถ้วนครอบคลุมอย่างเท่าเทียม ตรวจสอบได้ มีประสิทธิภาพและปลอดภัย การที่จะทำให้สิ่งที่เรียกว่า Data-driven research ระดับประเทศเกิดขึ้นอย่างยั่งยืนนั้นจึงเป็นเรื่องยากจนหลายคนเลือกที่จะมองข้าม

บทความนี้จึงจะพาทุกท่านไปสำรวจโมเดลของ National Health Service แห่งสหราชอาณาจักร ถึงการจัดวาง Infrastructure ทางด้านการเข้าถึงข้อมูลเพื่อเอื้อประโยชน์ให้แก่ฝ่ายทุกฝ่าย ทั้งนักวิจัย ประชาชนและตัวภาครัฐเอง

*อนึ่ง โมเดลของ TRE และ SDE ยังอยู่ในกระบวนการทดลองใช้ การนำโมเดลไปใช้งานย่อมต้องคำนึงถึงปัจจัยอื่นๆของแต่ละประเทศด้วย

แผนภูมิแสดงองค์ประกอบหลักของผู้มีส่วนเกี่ยวข้องกับข้อมูลทางการแพทย์

เมื่อพิจารณาถึงในแง่ผู้ใช้งาน องค์ประกอบที่สำคัญของผู้ใช้ข้อมูลเชิงการแพทย์มีทั้งหมด 3 องค์ประกอบหลัก

  1. ภาครัฐและโรงพยาบาล
  2. ภาคงานวิจัยและนวัตกรรม
  3. ภาคการศึกษา

แต่ละภาคส่วนล้วนมีความต้องการที่จะเข้าถึงข้อมูลเพื่อวิเคราะห์และวิจัย แต่กลับพบว่าการเก็บข้อมูลแบบแยกส่วนกันส่วนมากจะไม่มีมาตรฐานร่วมกันใดๆ ทำให้การที่แต่ละภาคส่วนจะสามารถเข้าถึงข้อมูลแบบข้ามไปมากันได้ ก็มักจะติดข้อจำกัดในเชิงกระบวนการการขอข้อมูลต่างๆมากมาย หรือเมื่อทำเรื่องการขอข้อมูลสำเร็จ ข้อมูลจะหลุดออกมาจากต้นทางและถูกคัดลอกออกมาสู่ฝั่งของผู้ขอข้อมูล ซึ่งอาจนำไปสู่ความเสี่ยงในเชิงการรักษาข้อมูลในอนาคต

แต่หากข้อมูลไม่ได้ถูกคัดลอกหรือปล่อยออกมาจากทางต้นทางตั้งแต่แรกล่ะ?

ถ้าหากว่านักวิจัยสามารถเข้าถึงข้อมูลบนInfrastructureของต้นทางแต่ยังสามารถExportผลลัพท์จากการวิเคราะห์ข้อมูลได้อยู่?

Trusted Research Environment (TRE)

Trusted Research Environment (TRE) เป็นServiceที่ถูกสร้างขึ้นมาเพื่อเป็นData Platformให้แก่นักวิจัยเข้าถึงข้อมูลทางด้านสาธารณสุข ภายในServiceนี้จะถูกติดตั้งให้กับผู้ถือครองข้อมูลหรือต้นทางของข้อมูล พร้อมกับมีเครื่องมือวิเคราะห์ทางสถิติเพื่อช่วยเหลือนักวิจัยในการเข้าถึงข้อมูลและทำวิจัยอย่างมีประสิทธิภาพมากที่สุด โดยที่นักวิจัยจะสามารถเข้าถึงข้อมูลเพียงในส่วนที่ได้รับอนุญาติเท่านั้น

Multi-party trusted research environment federation: Establishing infrastructure for secure analysis across different clinical-genomic datasets | Zenodo

Secure data environments (SDE) นับเป็นส่วนหนึ่งของ TRE (trusted research environments) สิ่งนี้เป็นเหมือน Virtual environment ที่อนุญาติให้ผู้ใช้งานสามารถเข้าถึงข้อมูลเพื่อทำการวิเคราะห์บนแพลตฟอร์มได้โดยตรงโดยไม่ต้องกระจายหรือเคลื่อนย้ายข้อมูลไปยังฝั่งของผู้ใช้งาน ดังนั้น SDE จึงเป็นแพลตฟอร์มที่ไม่เปิดให้ผู้ใช้งานดาวน์โหลดข้อมูลของข้อมูลดิบหรือRaw data แต่เปิดให้สามารถดาวน์โหลดข้อมูลที่ผ่านการวิเคราะห์มาแล้วเท่านั้น

ทุกการเข้าถึงข้อมูลของนักวิจัยใน Virtual environment ของ SDE จะถูกบันทึกและควบคุม การเปิดเผยและกระจายข้อมูลดิบทุกอย่างจากในแลปวิจัยสู่สาธารณะจึงไม่จำเป็นอีกต่อไป อีกทั้งข้อมูลส่วนตัวของเจ้าของข้อมูลจะไม่สามารถหลุดจากServerออกสู่ภายนอกได้เพราะการมีอยู่ของระบบประเมิน Monitoring และการบันทึกประวัติการดาวน์โหลดข้อมูลของตัวแพลตฟอร์มเอง

ทั้งนี้ ข้อจำกัดในเชิงInfrastructureอาจจะมีอยู่บ้าง หากInfrastructureของต้นทางตั้งอยู่บนCloud การคิดค่าใช้จ่ายตามการใช้งานแต่ละกลุ่มSDEน่าจะทำได้อย่างเป็นระบบและตรวจสอบได้ แต่ในกรณีที่เป็น On-prem การคิดค่าใช้จ่ายในเชิงResourceอาจจะค่อนข้างยุ่งยากเล็กน้อย (หากมีข้อมูลเพิ่มเติมในส่วนนี้จะมาอัพเดต)

หลักการที่TRE&SDEถูกสร้างมาเพื่อรักษาไว้ คือหลักการที่เรียกว่า 5 Safes อันประกอบด้วย

  1. Safe people
  2. Safe projects
  3. Safe settings
  4. Safe data
  5. Safe outputs

เรามาดูกันว่า Infrastructure แบบนี้จะตอบโจทย์หลัก 5 Safes ได้อย่างไรจากแผนภาพดังกล่าว

Building Trusted Research Environments — Principles and Best Practices; Towards TRE ecosystems | Zenodo

Safe setting: TRE ถูกติดตั้งอยู่ในData centreของต้นทางข้อมูล (เช่น รพ.หรือสาธารณสุข)

Safe People: มีแค่นักวิจัยที่ได้รับอนุญาติ จึงจะสามารถเข้าถึงInterfaceของข้อมูลได้

Safe Data: สามารถเข้าถึงแค่ข้อมูลที่ผ่านกระบวนการ ETL และถูกลบข้อมูลส่วนบุคคลออกไปแล้ว

Safe Projects: ข้อมูลโดยสังเขปของตัวProjectสามารถตรวจสอบได้และเผยแพร่ให้ผู้เข้าร่วมProject เพื่อให้เกิดความโปร่งใส

Safe output: ข้อมูลที่ Export สู่สาธารณะได้มีเพียงข้อมูลผลสรุปที่ผ่านการรีวิวแล้วเท่านั้น

หวังว่าข้อมูลและตัวอย่างการใช้งานดังกล่าวจะเป็นประโยชน์ต่อผู้อยากจะหยิบแนวความคิดนี้ไปปรับใช้และสร้างคุณประโยชน์ให้วงการแพทย์และงานวิจัยในอนาคต

Resource:

Trusted Research Environment service for England — NHS Digital

Secure data environment for NHS health and social care data — policy guidelines — GOV.UK (www.gov.uk)

Trusted Research Environments (TREs) — A Guide for Beginners — CF (carnallfarrar.com)

GM SDE

--

--

Ming Yanisa

Bioinformatics Engineer@Genomics England;Software developer@EMBL-EBI; ICE@CU; Data scientist internship@CERN; Contact: yanisa.sunt@gmail.com