AI의 가장 논리적 인 모델을 찾기 위해 Chatgpt 4.1을 O3 및 4O와 비교했습니다. 결과는 거의 비합리적 인 것 같습니다. - 바르셀로나

Chatgpt에 대한 GPT-4.1 OpenAI의 출시는 조용했지만 특히 논리적 추론 및 코딩에 대한 업데이트를 나타냅니다. 큰 맥락 창과 구조화 된 사고에 대한 이해는 많은 새로운 프로그래밍 및 퍼즐 솔루션에 문을 열 수 있습니다. 그러나 OpenAi는 종종 기술적으로 지루한 지루한 방식으로 모델의 인코딩 능력을 자랑합니다.

나는 논리적 코딩의 자연스러운 확장을 더 큰 인간의 관심사, 특히 수수께끼 및 논리 퍼즐에 적용하는 것이 더 흥미로울 것이라고 결정했습니다. GPT-4.1이 자체적으로 말하는 것을 보는 대신 다른 CATGPT 모델에 대해 발사하기로 결정했습니다. 나는 각 ChatGpt 사용자가 사용할 수있는 기본 선택 인 GPT-4O와 메스처럼 마음을 사용하여 수학, 코드 및 퍼즐을 씹기 위해 설계된 Openai 추론 모델 인 O3를 선택했습니다. 이 논리적 올림피아드는 특히 과학적이지 않지만 모델이 어떻게 발전하는지의 향기를 보여줄 것입니다.

상자에 고양이

나는 연역적 추론과 고양이의 박해 시험부터 시작하기로 결정했습니다. 나는 이것을 해결하기 위해 세 가지 모델에 말했다. 1에서 5까지의 번호가 매겨지는 5 개의 상자가 있으며, 여기에는 고양이가 숨겨져 있습니다. 매일 밤 그는 다음 상자로 뛰어 들고 매일 아침 상자를 열 수있는 기회가 한 번 있습니다. 고양이를 찾는 방법?

이 수수께끼는 추측 할뿐만 아니라, 시작하는 곳마다 마지막 날에 미끄러운 고양이를 잡을 수 있도록 보장하는 전략의 개발입니다.

GPT-4.1은 마치 마치 마치 마치 마치 수천 개의 퍼즐을 읽은 것처럼 다이빙했습니다. 그는 스마트 한 결정된 검색 템플릿을 제공했는데, 여기서 모든 가능성을 천천히 제거하는 순서대로 상자를 열었습니다. 이것은 심지어 고양이의 움직임을 시뮬레이션했다.

답을 통해 O3 모델이 22 초가 걸렸습니다. 그런 다음 그는 약간 더 멀티 크기의 설명을 가졌지 만 고양이를 찾는 데 동일한 전략과 5 일 최대 시간을 가졌습니다. GPT-4O는 놀랍게도 짧았고 그가 읽는 정도까지였습니다. 이것은 왜 그것이 작동하는지에 대한 세부 사항에 대해서는 그리 많지 않았지만, 그가“박해 전략”이라고 알려진 것을 어떻게 사용했는지 설명했습니다.

와이너리 공간

나는 숫자가 좋은 것으로 판명되었고, 우주와 물리학 주변의 미스터리로 제작 된 모델을 설치했습니다. 이것은 실제 사고에 보상하는 구식 학교의 수수께끼 중 하나입니다. 수학이없고, 코드도없고 물리와 상상력 만 있습니다. 미스터리가 갔다 : 뚜껑과 와인이없는 트렁크가 있습니다. “이 와인 트렁크는 절반 이상이 가득 차 있습니다. “아니요, 그렇지 않습니다.”라고 남자는 말합니다. “이것은 절반 미만입니다.” 와인을 측정하지 않거나 와인을 제거하지 않고 누가 옳은 사람을 어떻게 결정할 수 있습니까?

GPT-4.1은 이것을 우아하게 처리했습니다. 이것은 결정을 통해 나를 이끌어 냈습니다. 와인이 당신의 입술에 닿을 때까지 배럴을 기울입니다. 배럴의 바닥을 볼 수 있다면 절반 미만입니다. 그렇지 않다면, 이것은 절반 이상입니다. 답을 찾는 방법과 답변이 작동하는 이유를 다루는 간단한 단락 쌍.

O3 모델은 동일한 정보를 전송하기 위해 몇 개의 총알 포인트 만 사용하여 그의 대답으로 더 많은 스파르타가되었습니다. 어쨌든, AI는 이렇게하는 것이 이상하게 불필요하게 보였고, 대답을 설명하면서 “통치자없이, 사이펀도 없다 – 단지 느린 경사는 당신에게 옳은 사람을 알려줍니다.” 4O 답변은 다른 두 가지의 차이를 공유했습니다. 그는 대답하기 위해 두 개의 총알 안경을 사용했지만 그 뒤에 서있는 물리학에 대한 긴 설명을 썼습니다.

신비한 편지

나의 마지막 퍼즐은 논리와 완전히 다른 방향으로 갔다. 우리는 공제에 초점을 맞추는 대신, 단어 게임과 혀의 템플릿에 대해 이야기하고 있습니다. 세 가지 모델을 물었습니다. 분당 한 번, 눈을 깜박이면서 두 번, 천년에는 어떻게됩니까?

GPT-4.1은 글자 M이 어떻게 대답인지 설명하면서 3 개의 총알 지점에서 그것을 못 박았습니다. 문자가“분”과“순간”에서 어디에서 발생하는지, 왜“천 년”에 포함되지 않는지를 나타냅니다.

O3는 또한 3 개의 총알 포인트에 응답했지만, 각 지점에서 그는 몇 마디 만 나왔는데, 편지 M이 추가 문자가 아닌 횟수가 나타났습니다. GPT-4O에는 또한 몇 개의 짧은 총알 안경이 있었지만 적어도 사실 외부에서 설명을했습니다. 이것은 설명되었을 때 거의 고무적이었습니다. “해석의 속임수는 문자 그대로 (문자)가 아닌 (시간)가 아닙니다.

논리적 챔피언

고양이, 와인 및 알파벳에 대한 AI 모델과 대화하는 데 너무 많은 시간을 보냈으므로 논리적으로 몇 가지를 완성 할 수 있습니다. 모든 모델에는 매우 좋은 논리 작업이 있습니다. 그들은 그들의 답변이 얼마나 상세한 지에 따라 다를 수 있지만, 수수께끼 아래의 역학을 의미합니다.

GPT-4.1 이유는 이것이 잘 설명되었다는 것이 분명하며, 이제 그가 Chatgpt에 살고 있기 때문에 이것은 모든 논리 기반 문제에 적합한 선택 일 것입니다. 그러나 여기에는 코딩이 포함되지만, 위에서 언급 한 바와 같이, 이것은 개발을 특히 개발하는 것을 포착하는 것은 아니며 최종 결과 만 흥미로울 수 있다고 생각합니다.

그럼에도 불구하고 수수께끼를 해결하는 데 도움이 필요하다면 거의 모든 모델이 당신에게 잘 제공 될 것입니다. 그리고 그들 중 하나라도 순서대로한다면, 당신은 솔직히 완전히 비이성적 인 것처럼 보이는 차이를 알지 못할 수도 있습니다.

당신은 또한 좋아할 수도 있습니다

Source link

상자에 고양이

와이너리 공간

신비한 편지

논리적 챔피언

당신은 또한 좋아할 수도 있습니다

Related Posts

코네티컷 주 Danbury의 경제적 불확실성을 한 간식으로 항해함에 따라

여행하기 전에 다운로드 응용 프로그램의 포장 목록

유엔 안전 보장 이사회는 인도의 긴장에 관한 폐쇄 된 일일 협상에 관한 협상 회의를 시작합니다.

Leave a Reply Cancel reply