vesti.py 4.2 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119
  1. import re
  2. from .common import InfoExtractor
  3. from .rutv import RUTVIE
  4. from ..utils import ExtractorError
  5. class VestiIE(InfoExtractor):
  6. _WORKING = False
  7. IE_DESC = 'Вести.Ru'
  8. _VALID_URL = r'https?://(?:.+?\.)?vesti\.ru/(?P<id>.+)'
  9. _TESTS = [
  10. {
  11. 'url': 'http://www.vesti.ru/videos?vid=575582&cid=1',
  12. 'info_dict': {
  13. 'id': '765035',
  14. 'ext': 'mp4',
  15. 'title': 'Вести.net: биткоины в России не являются законными',
  16. 'description': 'md5:d4bb3859dc1177b28a94c5014c35a36b',
  17. 'duration': 302,
  18. },
  19. 'params': {
  20. # m3u8 download
  21. 'skip_download': True,
  22. },
  23. },
  24. {
  25. 'url': 'http://www.vesti.ru/doc.html?id=1349233',
  26. 'info_dict': {
  27. 'id': '773865',
  28. 'ext': 'mp4',
  29. 'title': 'Участники митинга штурмуют Донецкую областную администрацию',
  30. 'description': 'md5:1a160e98b3195379b4c849f2f4958009',
  31. 'duration': 210,
  32. },
  33. 'params': {
  34. # m3u8 download
  35. 'skip_download': True,
  36. },
  37. },
  38. {
  39. 'url': 'http://www.vesti.ru/only_video.html?vid=576180',
  40. 'info_dict': {
  41. 'id': '766048',
  42. 'ext': 'mp4',
  43. 'title': 'США заморозило, Британию затопило',
  44. 'description': 'md5:f0ed0695ec05aed27c56a70a58dc4cc1',
  45. 'duration': 87,
  46. },
  47. 'params': {
  48. # m3u8 download
  49. 'skip_download': True,
  50. },
  51. },
  52. {
  53. 'url': 'http://hitech.vesti.ru/news/view/id/4000',
  54. 'info_dict': {
  55. 'id': '766888',
  56. 'ext': 'mp4',
  57. 'title': 'Вести.net: интернет-гиганты начали перетягивание программных "одеял"',
  58. 'description': 'md5:65ddd47f9830c4f42ed6475f8730c995',
  59. 'duration': 279,
  60. },
  61. 'params': {
  62. # m3u8 download
  63. 'skip_download': True,
  64. },
  65. },
  66. {
  67. 'url': 'http://sochi2014.vesti.ru/video/index/video_id/766403',
  68. 'info_dict': {
  69. 'id': '766403',
  70. 'ext': 'mp4',
  71. 'title': 'XXII зимние Олимпийские игры. Российские хоккеисты стартовали на Олимпиаде с победы',
  72. 'description': 'md5:55805dfd35763a890ff50fa9e35e31b3',
  73. 'duration': 271,
  74. },
  75. 'params': {
  76. # m3u8 download
  77. 'skip_download': True,
  78. },
  79. 'skip': 'Blocked outside Russia',
  80. },
  81. {
  82. 'url': 'http://sochi2014.vesti.ru/live/play/live_id/301',
  83. 'info_dict': {
  84. 'id': '51499',
  85. 'ext': 'flv',
  86. 'title': 'Сочи-2014. Биатлон. Индивидуальная гонка. Мужчины ',
  87. 'description': 'md5:9e0ed5c9d2fa1efbfdfed90c9a6d179c',
  88. },
  89. 'params': {
  90. # rtmp download
  91. 'skip_download': True,
  92. },
  93. 'skip': 'Translation has finished',
  94. },
  95. ]
  96. def _real_extract(self, url):
  97. mobj = self._match_valid_url(url)
  98. video_id = mobj.group('id')
  99. page = self._download_webpage(url, video_id, 'Downloading page')
  100. mobj = re.search(
  101. r'<meta[^>]+?property="og:video"[^>]+?content="http://www\.vesti\.ru/i/flvplayer_videoHost\.swf\?vid=(?P<id>\d+)',
  102. page)
  103. if mobj:
  104. video_id = mobj.group('id')
  105. page = self._download_webpage(f'http://www.vesti.ru/only_video.html?vid={video_id}', video_id,
  106. 'Downloading video page')
  107. rutv_url = RUTVIE._extract_url(page)
  108. if rutv_url:
  109. return self.url_result(rutv_url, 'RUTV')
  110. raise ExtractorError('No video found', expected=True)