<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>KI-Evaluierung on Deutsche Roboter Blog</title>
    <link>https://blog.deutsche-roboter.de/tags/ki-evaluierung/</link>
    <description>Recent content in KI-Evaluierung on Deutsche Roboter Blog</description>
    <image>
      <title>Deutsche Roboter Blog</title>
      <url>https://blog.deutsche-roboter.de/og-default.png</url>
      <link>https://blog.deutsche-roboter.de/og-default.png</link>
    </image>
    <generator>Hugo -- 0.147.0</generator>
    <language>de</language>
    <lastBuildDate>Thu, 02 Apr 2026 08:08:41 +0200</lastBuildDate>
    <atom:link href="https://blog.deutsche-roboter.de/tags/ki-evaluierung/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>PhAIL: Neuer Benchmark bewertet Robotik-Foundation-Models erstmals auf echter Hardware statt nur in Simulationen</title>
      <link>https://blog.deutsche-roboter.de/posts/2026-04-02-phail-neuer-benchmark-bewertet-robotik-foundation-models-erstmals-auf-echter-har/</link>
      <pubDate>Thu, 02 Apr 2026 08:08:41 +0200</pubDate>
      <guid>https://blog.deutsche-roboter.de/posts/2026-04-02-phail-neuer-benchmark-bewertet-robotik-foundation-models-erstmals-auf-echter-har/</guid>
      <description>Kritische Analyse, warum bisherige Benchmarks die tatsächliche Leistungsfähigkeit von Foundation Models nicht abbilden und wie PhAIL mit Hardware-basierten Tests einen Paradigmenwechsel in der Robotik-Evaluierung einleitet</description>
    </item>
  </channel>
</rss>
