Grosse Sprachmodelle lernen aus «Büchern», indem sie Texte in kleine Einheiten, sogenannte Tokens, zerlegen. Diese Modelle achten genau darauf, was links und rechts von jedem Wort steht und erstellen für jedes Wort riesige Vektoren. Diese Vektoren enthalten alle möglichen Wahrscheinlichkeiten der Wörter, die in der Nachbarschaft auftauchen können, wodurch die Modelle das Zusammenspiel der Wörter […]
continue reading