“怎么了?”

        从上车起就皱着眉头。

        薛意眨了眨眼,单手碰碰眉心,好像这才意识到:哦。我在想一个问题。

        什么问题?曲悠悠耳朵竖起来了。

        Transformer架构里attention机制的数学本质,能不能用微分几何的框架重新表达。

        陶予之昨晚给我看了一篇新的预印本,我觉得他们的证明路径有一个gap。

        ……

        曲悠悠傻了。

        “啊?”

        这啥?

        内容未完,下一页继续阅读