Master-Thesis · htw saar / Fraunhofer-IZFP · Note 1,0

Feature-Selektion in hochdimensionalen Sensor-Daten.

Die Arbeit hatte zwei Ebenen: zuerst die Materialunterscheidung zweier Werkstoffe als stabiler Methodennachweis, danach die deutlich schwerere Zustandsunterscheidung über fünf mechanische Zustände. Ziel war eine Pipeline zur Merkmalsselektion, die Klassifikationsgüte erhält und zugleich zeigt, wo Sensorik, Feature-Selektion und kleine Stichproben an ihre Grenzen kommen.

2 Werkstoffe5 Zustände261 Initial-FeaturesGroupKFoldSperrvermerk: kuratierter Auszug
Zwei Aufgaben

Erst Werkstoffe trennen. Dann Zustände stress-testen.

Die stärkste Lesart der Thesis ist nicht nur die Feature-Reduktion. Entscheidend ist die Reihenfolge: Teil 1 beweist, dass die Pipeline grundsätzlich trägt. Teil 2 zeigt, wie anspruchsvoll die Zustandsklassifikation wird, wenn fünf Zustände materialübergreifend getrennt werden sollen.

Teil 1

Materialunterscheidung: zwei Werkstoffe

Die erste Aufgabe trennt die Werkstoffe 22NiMoCr3-7 und 20MnMoNi5-5. Hier konnte die Pipeline zeigen, dass 3MA-X8-Merkmale, Feature-Selektion und LDA ein kompaktes, belastbares Modell ergeben. Das war die Verifizierung der Pipeline-Funktionalität.

20
Features
98,8 %
Test BA
92,3 %
Reduktion

Verteidigungsanker: 99,5 % CV-BA, 98,8 % Test-BA und nur 0,7 Prozentpunkte Generalisierungslücke.

Teil 2

Zustandsunterscheidung: fünf Zustände

Die zweite Aufgabe unterscheidet 0,8 %, 2 % und 4 % plastische Dehnung sowie LCF 30 % und LCF 45 %. Das war der schwierigere Teil: Die Zustände liegen nicht als sauber getrennte Inseln im Merkmalsraum. Dieser Teil zeigt die physikalischen Grenzen der Trennbarkeit.

5
Klassen
86,8 %
Row BA
90,0 %
Probe BA

Verteidigungsanker: 4 % Dehnung war nahezu perfekt trennbar, 0,8 % Dehnung blieb die Grauzone.

Forschungsfragen

Sieben Fragen, zwei Antworttypen.

Die Kolloquiumsstruktur macht die Seite stärker: Erst wird die Methodik an der binären Materialfrage validiert, danach wird sie an der fünfklassigen Zustandsfrage kritisch belastet.

Q1-Q4 · Materialklassifikation

Wie viel Reduktion ist möglich, ohne Güte zu verlieren?

  • Welche Features bleiben robust und stabil?
  • Welche Ranking-Verfahren liefern bei sinnvollem K ähnliche oder bessere Leistung?
  • Bringt ein Konsensranking über zehn Methoden stabilere Feature-Auswahl?
Q5-Q7 · Zustandsklassifikation

Welche Zustände sind wirklich trennbar?

  • Fünf Verformungszustände unabhängig vom Werkstoff klassifizieren.
  • Gut trennbare Zustandspaare von problematischen Paaren unterscheiden.
  • Die Grenzen nicht wegmodellieren, sondern als physikalische Erkenntnis ausweisen.
Kontext

Wenn wenige Proben auf viele Sensormerkmale treffen.

Mikromagnetische Prüfsysteme erzeugen hochdimensionale Merkmalsräume aus wenigen physischen Proben. Das ist statistisch heikel: Kleine Stichprobe, viele korrelierte Features, mehrere Messungen pro Probe und ein hohes Leakage-Risiko.

261
Initial Features
3MA-X8 Multiparameter-Messung
36
Samples
p >> n: klassische Hochdimensions-Lage
20
Final Features
Materialmodell nach Backward-Elimination
30
Zustandsproben
fünf Zustände, jeweils materialübergreifend
Methodische Pipeline

Eine Vier-Stufen-Pipeline, jede Stufe begründet.

261 Features sind nicht durch Modellgröße zu erschlagen. Die Reduktion läuft sequenziell: Qualität prüfen, Korrelationen entfernen, Cluster verdichten, Multikollinearität senken.

Stufenweise Feature-Reduktion: 261 Initial -> 248 Quality -> 133 Pairwise -> 112 Clustering -> 77 VIF
Stufenweise Reduktion: 261 -> 77 Features (-70,5 %)
Wichtig: Die 77 Features sind die VIF-bereinigte Vorselektion. Der finale Leistungsanker der Materialunterscheidung ist die anschließende Backward-Elimination auf 20 Features mit 98,8 % Test-Balanced-Accuracy.
Stage 1Quality
Fehlwert- und Varianzfilter

Features mit Fehlwertquote > 5 % oder nahezu konstanten Werten raus.261 -> 248 (-13)

Stage 2Pairwise
Korrelations-Pruning

Pearson und Spearman simultan geprüft. Schwelle |rho| >= 0,95.248 -> 133 (-115, -46,4 %)

Stage 3Clustering
Hierarchisches Clustering

Average-Linkage mit Repräsentantenselektion pro Feature-Cluster.133 -> 112 (-21)

Stage 4VIF-Pruning
Variance Inflation Factor

Iteratives Pruning bei VIF > 20,0 entfernt verbleibende Multikollinearität.112 -> 77 (-35)

Validierung
5-fach GroupKFold auf Probenebene

Alle Messungen einer Probe landen gemeinsam in einer Fold. Dadurch wird verhindert, dass Messungen derselben physischen Probe gleichzeitig in Training und Test auftauchen. Genau dieser Punkt macht die Arbeit methodisch glaubwürdig: Die Validierung respektiert die reale Datenstruktur.

Konsens statt Glaube

10 Ranking-Verfahren, ein stabileres Signal.

Statt einen einzelnen Ranker absolut zu setzen, vergleicht die Pipeline zehn Methoden aus drei Klassen und aggregiert die Ergebnisse. Relevant ist, was methodenübergreifend stabil bleibt.

Filter

ANOVA-F, Mutual Information und korrelationsbasierte Verfahren: modellunabhängige Signale.

Embedded

Lasso und Random-Forest-Importances: Feature-Auswahl als Modell-Nebenprodukt.

Wrapper

Backward Elimination: direkter Optimierungspfad gegen die Modellgüte.

Ergebnisse

Ein starker Nachweis und ein ehrlicher Grenzfall.

Die Materialunterscheidung liefert den klaren Leistungsanker. Die Zustandsunterscheidung ist bewusst anders gerahmt: nicht als Scheitern, sondern als Grenzlandkarte der Methode bei fünf mechanischen Zuständen.

0,7 PP
Material Gap

CV-BA 99,5 %, Test-BA 98,8 %

20
Features

finales Materialmodell

98,8 %
Material Test BA

unabhängiges Hold-out-Set

35
Zustand Features

bestes B_K37-Modell

86,8 %
Zustand Row BA

90,0 % Probe-Level BA

Einordnung: Die 90,0 % Probe-Level-BA der Zustandsklassifikation entspricht 9 von 10 Testproben. Das ist stark, aber wegen der kleinen Testmenge bewusst vorsichtig zu lesen. Die Row-Level-BA von 86,8 % ist der robustere Vergleichswert für die fünf Zustände.
LDA-Pointcloud der Materialunterscheidung im reduzierten Merkmalsraum
Materialunterscheidung: klare Trennung im 1D-LDA-Raum
Konfusionsmatrix der Materialunterscheidung auf dem Hold-out-Test-Set
Materialunterscheidung: Hold-out-Test-Set
Konfusionsmatrix der Zustandsklassifikation über fünf Zustände: 0,8 Prozent, 2 Prozent, 4 Prozent, LCF 30 Prozent und LCF 45 Prozent
Zustandsunterscheidung: 4 % stabil, 0,8 % als Grauzone, 0,8 % vs. LCF 30 % als Hauptverwechslung
Ranking-Verfahren im Vergleich: Modellgüte über Feature-Anzahl
Ranking-Verfahren im Vergleich: Modellgüte über Feature-Anzahl
Lessons Learned

Was bleibt, wenn die Pipeline läuft.

01
Der eigentliche Sprung war der Umgang mit LLM-gestützter Recherche.

Perplexity half, belastbare Quellen und peer-reviewte Paper schneller zu finden; NotebookLM wurde zum Ort, an dem Quellen, Podcasts, Videos und kleine Wissensbasen für ML, NDT und Methodik zusammenliefen.

02
Agentische Tools haben aus vier Monaten einen anderen Arbeitsmodus gemacht.

Der kurzfristige Themenwechsel zwang zu sehr schneller Einarbeitung. Rückblickend war das der Moment, in dem klar wurde, wie mächtig diese Werkzeuge werden, wenn man sie diszipliniert in Recherche, Strukturierung und Umsetzung einbettet.

03
p >> n erfordert Pipeline-Disziplin, nicht mehr Modell.

Wenn deutlich mehr Merkmale als unabhängige Proben vorliegen, ist die Antwort nicht ein noch stärkeres Modell. Erst reduzieren, dann modellieren.

04
Validierung muss die Probenstruktur respektieren.

Mehrere Messungen pro Probe dürfen nicht über Training und Test verteilt werden. GroupKFold ist hier kein Detail, sondern der Schutz gegen Leakage.

05
Die Materialtrennung ist der belastbare Nachweis.

Zwei Werkstoffe lassen sich mit einem kompakten 20-Feature-Modell sehr stabil trennen. Das ist der klare Proof-of-Method.

06
Die Zustandsunterscheidung ist der Grenztest.

Fünf mechanische Zustände über zwei Werkstoffe hinweg sind deutlich schwerer, weil Mikrostrukturänderungen kontinuierlich verlaufen und Klassen physikalisch überlappen.

07
Transparente Modelle gewinnen, wenn der Datenraum klein ist.

LDA mit wenigen Features ist debugbar, interpretierbar und reproduzierbar. Das war wertvoller als ein schwer erklärbarer Black-Box-Gewinn.

Grenzen

Der schwere Teil war nicht die Zahl der Features, sondern die Zustände.

Die Seite soll nicht nur eine Erfolgszahl zeigen. Für technische Entscheider ist fast wichtiger, dass die Arbeit sauber erklären kann, wo und warum die Methodik an Grenzen stößt.

Kleine Stichprobe limitiert Verallgemeinerung.

36 Samples für die Materialfrage und 30 Proben für die Zustandsfrage sind realistische industrielle Datenlagen, aber sie begrenzen jede Aussage über neue Werkstoffchargen, Anlagen oder Messbedingungen.

Zustände überlappen physikalisch.

Plastische Verformung und Low-Cycle-Fatigue verändern Mikrostruktur kontinuierlich. 4 % Dehnung war nahezu perfekt trennbar, aber 0,8 % Dehnung überschneidet sich mit 2 % und LCF 30 %. Die fünf Zustände sind deshalb kein sauber separiertes Klassifikationsspiel, sondern ein Trennbarkeitsproblem an der Grenze der Mess- und Merkmalsinformation.

Nicht jede bessere Metrik ist bessere Erkenntnis.

Der sinnvolle Output ist hier nicht, die Grenzfälle mit mehr Modellkomplexität zu überdecken, sondern systematisch zu zeigen, welche Zustandspaare stabil unterscheidbar sind und wo zusätzliche Daten, Prozesswissen oder andere Sensorik nötig wären.

Sperrvermerk

Case Study statt Volltext.

Die vollständige Thesis wird wegen Sperrvermerk nicht öffentlich bereitgestellt. Diese Seite zeigt bewusst nur kuratierte Methodik, Ergebnisse, Visualisierungen und Grenzen.

Details im Gespräch

Keine Rohdaten, keine vollständigen Anhänge, kein öffentlicher PDF-Download.