환경적 요인
NIH(국립보건원)는 NIH 자금 지원을 받는 모든 연구자가 NIH 데이터 관리 및 공유(DMS) 계획을 작성, 구현 및 보고하도록 요구하는 새로운 데이터 관리 및 공유 정책을 가지고 있습니다. 1월 25일에 발효된 새로운 정책은 납세자가 자금을 지원한 연구가 대중에게 공개되도록 보장하는 것입니다. DMS 계획에는 정부 연구 데이터를 FAIR(검색 가능, 액세스 가능, 상호 운용 가능, 재사용 가능) 원칙으로 전환하는 데 도움이 되는 6가지 요소가 포함되어 있습니다.
새로운 임무에 따라 환경 건강 과학 연구자들을 지원하기 위해 NIEHS EHLC(Environmental Health Language Collaborative)는 "환경 건강 과학 데이터 공유: 메타데이터, 표준 및 도구"라는 제목의 반나절 워크숍 3회를 주최했습니다.
NIEHS 데이터 과학실의 프로그램 관리자이자 의장인 스테파니 홈그렌(Stephanie Holmgren)은 "워크샵의 목적은 연구자들이 새로운 2023 정책을 준수하기 위해 사용할 수 있는 메타데이터, 표준 및 도구에 대한 인식을 높이고 사용을 장려하는 것이었습니다"라고 말했습니다. 워크숍 프로그램 기획위원회. "워크숍은 NIH 데이터 관리 및 공유 계획을 개발 또는 구현할 예정이거나 환경 보건 과학 데이터를 효과적으로 관리, 공유 및 재사용하는 방법을 배우는 데 관심이 있는 모든 사람을 대상으로 했습니다."
EHLC의 사명에 맞춰 워크숍 시리즈의 초점은 환경 보건 과학 분야의 연구자들이 DMS 계획에 포함해야 하는 6가지 필수 정책 요소 중 첫 번째 요소(데이터 설명)와 세 번째 요소(표준)를 준수하도록 돕는 것이었습니다. 프레젠테이션에서는 메타데이터 주석을 위한 도구를 다루었으며 환경 보건 과학 연구와 관련된 온톨로지 및 통제된 어휘를 찾고 사용하는 방법에 대한 정보가 포함되었습니다.
DMS 계획의 첫 번째 요소의 목적은 데이터 검색에 도움이 되는 자세한 설명과 명명 규칙을 적용하는 것입니다. 특히 메타데이터 세부정보가 포함될 것으로 예상됩니다. 메타데이터는 과학적 데이터를 해석하고 재사용할 수 있도록 추가 정보를 제공하는 데이터입니다.
예를 들어 모든 데이터는 저장소에 저장되며 표준화된 설명은 주석, 검색 기능 및 정보 추출에 도움이 됩니다. 일관된 용어를 사용함으로써 연구 데이터를 재사용하고 상호 운용할 수 있습니다.
Holmgren은 “메타데이터는 데이터가 생성된 방식과 데이터의 내용을 전달하는 데 도움이 되기 때문에 매우 중요합니다.”라고 말했습니다. “그러면 다른 사람이 그 데이터를 이해할 수 있을 뿐만 아니라 기계도 그 데이터를 이해할 수 있습니다. 기계의 힘을 사용하면 데이터에 대한 추론이나 패턴 확인 측면에서 데이터로 더 많은 작업을 수행할 수 있으므로 연구자가 더 복잡한 질문을 해결할 수 있습니다.”
명확한 설명 외에도 환경 보건 과학 데이터가 어떻게 구성되어야 하는지에 대한 커뮤니티 개발, 합의 및 표준 채택의 필요성도 필요합니다.
스탠포드 대학의 Mark Musen 박사는 워크숍 프레젠테이션에서 "데이터를 공정하게 만들려면 좋은 메타데이터가 있어야 하며, 커뮤니티에서 승인한 메타데이터 표준이 있을 때 좋은 메타데이터가 생성됩니다."라고 말했습니다. .
이 시리즈에서는 환경 보건 과학과 관련된 기본 표준과 연구의 특정 측면에 대한 표준이 존재하지 않는 경우 수행할 작업에 대한 자세한 모범 사례를 강조했습니다.
Holmgren은 "우리는 모든 연구가 독특하고 고유한 측면을 가지고 있다는 것을 알고 있지만 생식 독성학 연구 또는 환경 역학 연구의 성격에는 여전히 근본적인 공통 분모가 있습니다"라고 말했습니다.
DMS 계획의 구현에는 데이터 공유가 포함됩니다.
“'요청 시 데이터가 공유됩니다'라고 말하는 것만으로는 더 이상 충분하지 않습니다. 이제는 실제로 데이터를 저장소에 제출해야 한다는 요구 사항이 있습니다.”라고 Holmgren은 말했습니다.
리포지토리 공유 모범 사례에는 다음이 포함됩니다.
Holmgren은 “새 정책의 핵심은 데이터 공유가 왜 중요한지에 대한 가치를 전달하려고 노력하는 것입니다.”라고 말했습니다. “데이터를 제대로 공유하려면 데이터를 효과적으로 관리해야 합니다. 데이터 관리는 연구 수명주기 전반에 걸쳐 이루어지기 때문에 두 가지가 복잡하게 연결되어 있습니다. DMS 계획은 연구자들이 연구를 수행하기 전에 데이터 관리 및 데이터 공유 문제에 대해 미리 생각하는 데 도움이 됩니다.”