[NIXP] Cognitive Toolkit — Open Source-система машинного обучения, распознавания речи и изображений от Microsoft

Обсуждение новостей, соответствующих тематике форума

Модератор: Модераторы разделов

Аватара пользователя
Dmitry Shurupov
Сообщения: 336
Статус: Open Source geek
ОС: Ubuntu Linux

[NIXP] Cognitive Toolkit — Open Source-система машинного обучения, распознавания речи и изображений от Microsoft

Сообщение Dmitry Shurupov »

Во вторник корпорация Microsoft представила бета-версию своей Open Source-системы Cognitive Toolkit, предназначенной для распознавания речи и изображений. На прошлой неделе подразделение Microsoft, специализирующееся на работе с искусственным интеллектом (Microsoft Artificial Intelligence and Research), сообщило о прорыве в распознавании речи: её система для транскрипции человеческой речи допускает всего 5,9 % ошибок при распознавании разговорной речи. Это стало возможным благодаря применению наработок из Open Source-проекта Computational Network Toolkit (CNTK), бета-версия которого была выпущена на днях под новым названием — Cognitive Toolkit. Изначально созданный для распознавания речи проект уже заметно вырос в своём применении, и сегодня Microsoft описывает Cognitive Toolkit как «систему для глубокого обучения (deep learning), используемую для ускорения развития таких областей, как распознавание речи и изображений, релевантности поиска на обычных компьютерных процессорах и графических процессорах NVIDIA». «Мы сделали из исследовательского инструмента нечто, что работает в промышленном окружении», — заявил Фрэнк Сейд (Frank Seide), главный исследователь в Microsoft Artificial Intelligence and Research и ключевой архитектор продукта Microsoft Cognitive Toolkit. В последней версии утилит была улучшена производительность (особенно при работе с большими объёмами данных, распределённых по разным компьютерам) и появилась поддержка машинного обучения, называемого reinforcement learning — обучения с подкреплением (агент обучается, взаимодействуя с некоторой средой). Набор утилит Microsoft Cognitive Toolkit опубликован на GitHub под свободной лицензией MIT и доступен для использования на языках программирования Python и C++.


оригинал на www.nixp.ru
По-моему, это еще один повод перейти на Убунту.
Спасибо сказали:
azsx
Сообщения: 3684
ОС: calculate linux, debian, ubuntu

Re: [NIXP] Cognitive Toolkit — Open Source-система машинного обучения, распознавания речи и изображений от Microsoft

Сообщение azsx »

бета-версию своей Open Source-системы Cognitive Toolkit, предназначенной для распознавания речи и изображений.

круто!
на языках программирования Python и C++.

ээх...
Спасибо сказали:
NickLion
Сообщения: 3408
Статус: аватар-невидимка
ОС: openSUSE Tumbleweed x86_64

Re: [NIXP] Cognitive Toolkit — Open Source-система машинного обучения, распознавания речи и изображений от Microsoft

Сообщение NickLion »

azsx писал(а):
27.10.2016 11:05
на языках программирования Python и C++.

ээх...

А какие языки вы ожидали? PHP? :rofl:
Python, R и С++ (часто только для участков, где нужна скорость) наиболее часто используются в современных научных исследованиях. Так что вполне ожидаемые языки.
Спасибо сказали:
azsx
Сообщения: 3684
ОС: calculate linux, debian, ubuntu

Re: [NIXP] Cognitive Toolkit — Open Source-система машинного обучения, распознавания речи и изображений от Microsoft

Сообщение azsx »

NickLion только бы прикалываться. Я java стал учить (на 190 странице, Шилдт). У неё есть один плюс есть. А они на питоне пишут.
оффтопик
Python, R и С++ (часто только для участков, где нужна скорость) наиболее часто используются в современных научных исследованиях.

Откровенно не понимаю чем Python лучше php.
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 21449
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: [NIXP] Cognitive Toolkit — Open Source-система машинного обучения, распознавания речи и изображений от Microsoft

Сообщение Bizdelnick »

azsx писал(а):
27.10.2016 11:53
У неё есть один плюс

А у C++ есть два плюса.
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
NickLion
Сообщения: 3408
Статус: аватар-невидимка
ОС: openSUSE Tumbleweed x86_64

Re: [NIXP] Cognitive Toolkit — Open Source-система машинного обучения, распознавания речи и изображений от Microsoft

Сообщение NickLion »

azsx писал(а):
27.10.2016 11:53
NickLion только бы прикалываться. Я java стал учить (на 190 странице, Шилдт). У неё есть один плюс есть. А они на питоне пишут.
оффтопик

Java — это хорошо. Не то, чтобы мне она особо нравилась, но на практике используется часто.

azsx писал(а):
27.10.2016 11:53
Python, R и С++ (часто только для участков, где нужна скорость) наиболее часто используются в современных научных исследованиях.

Откровенно не понимаю чем Python лучше php.

Python — хорошо структурированый язык, с достаточно ожидаемым поведением, нормальная привязка к Qt, изначально разработан как язык программирования, а не шаблонизатор. Плюс для научных исследований содержит достаточно большое число библиотек, например, NumPy, SymPy, SciPy.
Спасибо сказали:
azsx
Сообщения: 3684
ОС: calculate linux, debian, ubuntu

Re: [NIXP] Cognitive Toolkit — Open Source-система машинного обучения, распознавания речи и изображений от Microsoft

Сообщение azsx »

А у C++ есть два плюса.

Так как С я так и не осилил - смысла осиливать С++ не вижу, он ешё сложнее...
NickLion я слабо понимаю в чём структурная целостность Python так уж хороша. Кстати я слабо понимаю как язык с динамической типизацией может серьёзно использоваться для научных расчётов. Как Генка в мультике, чтобы некоторые опыты заканчивались пшиком вместо взрыва, рассчитанного при моделировании.
---
но на практике используется часто.

php и C используют намного чаще. Но среднему программситу (то есть мне) проще чуть чуть выучить java и оставшись работать в РФ какое-то время работать не только на еду. Хотя как дела в реальном секторе экономики движутся - я тупо оптимист.
Спасибо сказали:
NickLion
Сообщения: 3408
Статус: аватар-невидимка
ОС: openSUSE Tumbleweed x86_64

Re: [NIXP] Cognitive Toolkit — Open Source-система машинного обучения, распознавания речи и изображений от Microsoft

Сообщение NickLion »

PHP чаще всего используется в роли "вот есть CMS'ка, её и допилили", если же речь, о разработке продуктов, то PHP далеко не лидер, в отличии от Java. А уж по количеству библиотек Java на голову впереди.

А типизация у Python динамическая, но сильная, в большинстве случаев этого вполне достаточно. Вот, некоторые причины любви к Python в научной области.
Спасибо сказали:
azsx
Сообщения: 3684
ОС: calculate linux, debian, ubuntu

Re: [NIXP] Cognitive Toolkit — Open Source-система машинного обучения, распознавания речи и изображений от Microsoft

Сообщение azsx »

PHP чаще всего используется в роли "вот есть CMS'ка, её и допилили", если же речь, о разработке продуктов, то PHP далеко не лидер, в отличии от Java.

NickLion здесь две стороны одной монетки. С одной стороны я знаю, что вы не правы, очень многие штуки непосредственно связанные с интернетом сделаны на php. Но во первых никаких примеров я приводить не буду (считайте, что я слился). Во вторых Вы совершенно правы, взрослые дяди (эффектные менеджеры) уже давно для многих задач связанных со словом сервер всегда выбирают java. Вне зависимости от оптимальности такого выбора (ну выбор оптимален, чтобы за будущие просчёты не волноваться, а они будут). То есть не php. Сам я как считал, так и считаю, что в тех ситуациях когда начинает не хватать скорости php, прирост по производительности обеспечит только чистый С.
А типизация у Python динамическая, но сильная, в большинстве случаев этого вполне достаточно

Вообще то я рассчитывал услышать про аннотации и общие слова, что язык развивается. Понавилась фраза "в большинстве". Но иногда вместо рассчитанного взрыва будет пшик.
Вот, некоторые причины любви к Python в научной области.

Почитал. В очередной раз убедился, что мне лично pyton совсем не нужен и никому я его не посоветую. Вряд ли кому-то интересны причины.
Только жаль, что библиотека на С++ (которого я не знаю) и pyton (который я не знаю и мне и не надо).
Спасибо сказали: