Artificial Intelligence, Machine Learning, Data Science chat FAQ https://gist.github.com/listochkin/c81c198a2b7b044a0dc5
Приветствую всех!
Напоминаю, что до 31 марта действует ранняя цена билетов на конференцию DataScience Lab, которая пройдет в Одессе 13 мая. Зарегистрироваться можно на сайте http://www.datascience.in.ua/
Также, программный комитет конференции приступает к отбору ранее присланных тем докладов. Все желающие еще могут подать свои темы на сайте конференции. Темы докладов принимаем до 15 апреля, но желательно не тянуть до последнего;)
Буду благодарен всем за распространение информации о конференции и сроках подачи докладов среди своих сотрудников.
Привіт, сайєнтісти)
Таке питання: мені треба з html сторінки витягнути основну інформацію. Наприклад є на medium якась технічна стаття, мені треба витягнути заголовок статті, сам текст + картинки, ключові слова (якщо є, на деяких сайтах є )
Я звісно знаю, що можна заюзати XPath, але по ідеї, це має бути "універсальний парсер", що має працювати на будь яких сайтах.
Можна таке вирішити з допомогою AI, DS?
PS. Таке точно вміє гугл, на мобільних він часом пропонує оптимізувати сторінку під мобільні - просто видаляє всі футери, хедери, сайдбари, щалишає статтю і заголовок... І телеграм має якийсь схожий вбудований пронцип перегляду статей)