Promotionsvortrag von Markus Stabrin
- Verteidigung
Die Einzelpartikel-Kryo-EM wird immer zugänglicher für Forschende aus den verschiedensten Forschungsgebieten. Weiterhin haben neueste Innovationen im Bereich der verwendeten Hardware und neuartige Strategien bei der Datenakquise zu einem Anstieg der Qualität, sowie der Quantität von Daten geführt. Allerdings korreliert die Qualität des Datensatzes nicht direkt mit der Qualität eines einzelnen Bildes oder der Anzahl an aufgenommenen Bildern, sondern ist von der verwendeten Probe abhängig. Doch aus großen Daten folgt große Verantwortung und nur einen großen Datensatz aufzunehmen ist nicht immer vorteilhaft. Um das meiste aus der Datenakquise herauszuholen, muss der Forschende diese genaustens überwachen und die Daten durchgängig begutachten und bewerten. Dies geschieht idealerweise bereits während der Datenakquise. Daher bekommt die automatische Prozessierung und Analyse der aufgenommenen Daten während der Datenakquise eine immer größer werdende Bedeutung. Um alle nötigen Informationen in möglichst kurzer Zeit zusammenzutragen, sollten idealerweise alle wichtigen Pre-Processing Schritte noch während der Akquise durchgeführt werden. Auf diese Weise ist es möglich aus den Informationen Rückschlüsse auf die Qualität der Probe zu ziehen und in die Datenakquise einzugreifen. Es gibt bereits verschiedenste Tools zum Ausführen einer solchen Pipeline, doch arbeiten diese mit statischen Settings, wodurch ihr Anwendungsgebiet eingeschränkt ist. In dieser Doktorarbeit präsentiere ich TranSPHIRE; Ein Tool zur vollautomatischen Datenprozessierung während der Datenaufnahme. Dabei führt es alle wichtigen Pre-Processing Schritte parallel für Projekte der Einzelpartikelanalyse, sowie filamentöse Proben, aus. Weiterhin präsentiert es alle Informationen über die einzelnen Schritte der Datenprozessierung innerhalb der TranSPHIRE GUI, wodurch eine schnelle Evaluation der Datenakquise ermöglicht wird. TranSPHIRE beinhaltet zusätzlich die auf maschinellem Lernen basierte „Feedback loop“, welche das „Particle picking“ so optimiert, dass es sich an jede Probe anpasst. Genauer gesagt besteht diese aus einem iterativen Prozess bestehend aus „Particle picking“, „2D classification“, „2D class selection“ und dem Trainieren eines neuen Modells für das „Particle picking“. Die auf diese Weise gereinigten und optimierten Partikel können daraufhin in ein anschließendes „3D refinement“ gegeben werden. Für die weitere Analyse der Daten können die erzeugten Partikel und Volumen in andere Softwarepakete, wie beispielsweise SPHIRE, überführt werden. Die Möglichkeiten der TranSPHIRE Pipeline habe ich anhand von drei Szenarios demonstriert: Eine zuvor unbekannte Probe, einem Datensatz mit zwei Populationen und eine filamentöse Probe. In allen drei Fällen konnte vollautomatisch eine hochaufgelöste Struktur des gewünschten Proteins erreicht werden. Daher könnte die vollautomatische Prozessierung und Optimierung den Weg ebnen, um High-Throughput-Screening von unbekannten Proben für die Kryo-EM zu ermöglichen. Trotz jahrelanger Forschung ist die Prozessierung von filamentösen Proben weiterhin eine Herausforderung. Dies liegt unter anderem daran, dass die meisten „3D refinement“ Algorithmen Vorwissen über die helikale Symmetry des Proteins benötigen. Allerdings ist die Symmetry in den meisten Fällen lokal begrenzt, wodurch es zu niedrigen Auflösungen oder sogar inkorrekten Strukturen kommen kann. Hier präsentiere ich sp_meridien_alpha.py, eine Modifikation des „3D refinement“ Programms sp_meridien.py, welches die Prozessierung von filamentösen Proben im SPHIRE Software Paket ermöglicht. Dabei erfordert mein angepasster Algorithmus kein Wissen über die helikale Symmetry, sondern es werden Einschränkungen vom Filament selbst genutzt. In dieser Arbeit zeige ich anhand von zwei Beispielen, einem Datensatz des Tabakmosaikvirus und einem Actomyosin Datensatz, dass die erreichte Auflösung, sowie die Qualität der Rekonstruktion, welche von sp_meridien_alpha.py erzeugt wurden, die von sp_meridien.py übertreffen. Zusammenfassend lässt sich sagen, dass die Kombination aus TranSPHIRE und dem „3D refinement“ Programm sp_meridien_alpha.py die Datenakquise und die Prozessierung in der Kryo-EM vereinfacht und stellt daher einen wertvollen Beitrag für das Feld dar.