Преглед

  • Дата на основаване юни 19, 2009
  • Сектори Военна дейност
  • Публикувани работни места 0
  • Разгледано 6

Описание на компанията

DeepSeek’s First-generation Reasoning Models

DeepSeek’s first-generation reasoning designs, achieving efficiency equivalent to OpenAI-o1 throughout math, code, and reasoning jobs.

Models

DeepSeek-R1

Distilled designs

DeepSeek team has actually shown that the thinking patterns of larger designs can be distilled into smaller sized designs, leading to much better efficiency compared to the thinking patterns discovered through RL on little designs.

Below are the models developed through fine-tuning against several dense designs commonly utilized in the research neighborhood using reasoning data generated by DeepSeek-R1. The examination results show that the distilled smaller sized dense designs carry out incredibly well on standards.

DeepSeek-R1-Distill-Qwen-1.5 B

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Llama-70B

License

The design weights are certified under the MIT License. DeepSeek-R1 series assistance industrial use, enable for any modifications and derivative works, consisting of, however not restricted to, distillation for other LLMs.

„Проектиране и разработка на софтуерни платформи - кариерен център със система за проследяване реализацията на завършилите студенти и обща информационна мрежа на кариерните центрове по проект BG05M2ОP001-2.016-0022 „Модернизация на висшето образование по устойчиво използване на природните ресурси в България“, финансиран от Оперативна програма „Наука и образование за интелигентен растеж“, съфинансирана от Европейския съюз чрез Европейските структурни и инвестиционни фондове."

LTU Sofia

Отговаряме бързо!

Здравейте, Добре дошли в сайта. Моля, натиснете бутона по-долу, за да се свържите с нас през Viber.