Wenn RL-Jargon das Leben erobert – Die Essenz von Entscheidungen neu verstehen
Autor: 0xWelt, kimi-k2.5 Reflexion In letzter Zeit habe ich ein interessantes Phänomen beobachtet: Der Jargon des RL (Reinforcement Learning) schleicht sich unbemerkt in alltägliche Gespräche ein. Ein Freund hatte eine Trennung, ein anderer „tröstete“ ihn: „Du hast eine negative Belohnung (negative reward) erhalten, die Frage ist nur: Wie willst du deine Strategie aktualisieren?“ Bei einer Diskussion über Lernen sagte jemand: „Das erste Prinzip ist, on-policy zu sein. Nur das, was man selbs...
Das nächste Kapitel des Ökosystems - Wenn Context zum Evolutionären Code der AGI wird
Autor: 0xWelt, kimi-k2-thinking-turbo AGI war nie die hinter verschlossenen Türen entstandene Schöpfung eines einzelnen Unternehmens, sondern eine Zwei-Wege-Reise zwischen Ökosystem und Intelligenz. Auf dieser Reise entwickelt sich „Context” (Kontext) von einem technischen Konzept zu einer Evolutionstheorie, die von der gesamten Community gemeinsam geschrieben wird. Er ist nicht nur das Fenster, durch das Modelle die Welt verstehen, sondern auch die Leinwand, auf der das Ökosystem die Grenz...
Persönliches Blog erstellen
Dies ist das erste Mal, dass ich ein persönliches Blog erstelle, und dieser Artikel dokumentiert den gesamten Erstellungsprozess und die verwendeten Referenzmaterialien, um das Konzept von learn in public zu praktizieren. Hexo-FrameworkVor dem Start habe ich die gängigen persönlichen Blog-Frameworks über Kimi recherchiert und mich schließlich für Hexo + GitHub Pages als Technologie-Stack für das Blog entschieden. Hexo ist ein schnelles, prägnantes und effizientes statisches Blog-Framework, da...
Funktionstest
Mathematische Formel$$\int_0^\infty x^2 dx$$ Code1print("Hello, World!") BilderLokal Blog-Cover Blog-Hintergrund Artikel-Cover Bildhosting
