Комментарии
Илья, напишите мне на почту, постараюсь помочь
Илья, 8 Окт 2021 — 20:55.#2
Присоединяюсь. Столкнулся с той же проблемой, парсер не может сохранить файл, если задавать ему имя по столбцу…
Владимир, 21 Май 2021 — 16:50.#3
Добрый день. Что-то не так с этими значениями артикула, хотя в excel они выглядят, как обычные. У меня есть ваша программа PastePictures, так она тоже не может именовать картинки по значению этих артикулов. В чем может быть причина?
Владимир, не видя файла настроек, не могу сказать.
Можем настроить под заказ.
Владимир, 20 Май 2021 — 19:28.#5
Да, причина в наименовании файла. Если берется имя из URL, то картинка скачивается, если задается по маске(данные из столбца), то файл не скачивается. Выбирается столбец с артикулами. В чем проблема?
Владимир, возможно неверно задано имя файла (файл не удаётся сохранить по заданному пути и под заданным именем файла)
Владимир, 20 Май 2021 — 14:10.#7
Добрый день. Парсер нормально отработал по сайту, все параметры вывелись в excel, в том числе, ссылки картинок, но сами картинки не загрузились. Парсер выдает сообщение: Ошибка скачивания файла-Не удалось скачать файл по ссылке: https://… Но сама ссылка рабочая и по ней картинка замечательно открывается. ??
Раздел Импорт из Excel – предназначен для загрузки текстовых данных о товарах и услугах компании в формате XLS, XLSX, CSV.
Это может быть файл созданный по нашему шаблону для импорта, или же, к примеру, файл экспортированый с другого сайта в формате XLS, XLSX, CSV.
Рассмотрим ошибки в файле импорта, которые чаще всего допускают пользователи и решения для корректировки.
Сообщение об ошибке » В выбранном файле не все обязательные поля или файл поврежден». Как это решить?
1. Возможно, при создании файла импорта, используя наш шаблон, были допущены ошибки. В шаблоне импорта первая строка файла это подсказки, а в файле импорта первой строкой должны идти названия колонок. Нужно удалить первую строку с подсказками перед сохранением заполненного файла:
2. Ошибка возникает при попытке загрузить файл не в формате xls, xlsx или csv при импорте из Excel. Измените расширение импортируемого файла.
Если файл создан в результате экспорта с другого сайта проверьте его на соответствие с нашим шаблоном и наличием обязательных полей/колонок в файле Excel. Посмотреть правила составления файла Excel можно в Кабинете компании — Товары и Услуги — Импорт из Excel
3. Формат одной или нескольких ячеек выбран не верно. Например, в колонке ЦЕНА значение должно быть числовое и целое:
4. Если файл импорта был создан не из нашего шаблона тогда ошибка может быть из-за отсутствия или неверного заполнения поля колонок Адрес_подраздела и Идентификатор_подраздела. Если файл импорта создан из шаблона, импорт происходит даже если эти поля пустые.
После импорта отсутствуют фото к товару , хотя он были в файле импорта. Почему?
Причин, почему в результате импорта картинка не отобразилась, может быть несколько. Если это не связано с настройками импорта, то причину можно найти в файле импорта.
1. В файле импорта не указаны URL для изображений. Для импорта из Excel это колонка Ссылка_изображения. Ссылки должны быть разделены запятыми с пробелами:
Проверьте наличие ссылки в строке товара в колонке для фото, возможно там пустая строка или ссылка картинки указана с ошибкой, не полностью.
2. Также нужно проверить доступность ссылки, если это ссылка на картинку с сайта — скопируйте её и вставьте в строку браузера. Перейдите по адресу ссылки — если картинка отображается — адрес ссылки корректный.
Импорт прошел и у всех товаров теперь статус «Наличие не известно». Почему?
Для обозначения статуса наличия в колонке Наличие применяется:
Если оставить поле наличия пустым — статус вашего товара станет Наличие не известно.
Не отобразилась скидка после импорта. В чем причина?
Колонка Скидка должна иметь процентное или числовое значение, если в этой колонке (или ячейке) значение было указано не % или число — скидка не отобразится. На примере изображения ниже преобразуйте ячейки колонки Скидка в нужный формат:
В файле импорта были заполнены характеристики, но в карточке товара они оказались в Дополнительном. Почему?
На сайте компании и на портале Основные характеристики могут выступать фильтрами при поиске, а Дополнительные характеристики просто отображаются в описании к товару списком.
Если были указаны характеристики, но после импорта они отражаются в Дополнительных, значит для Рубрики, к которой относится товар, нет такой характеристики в нашей базе и система перенесла эти атрибуты в дополнительные.
Мнение эксперта
Знайка, самый умный эксперт в Цветочном городе
Если у вас есть вопросы, задавайте их мне!
Задать вопрос эксперту
Знание языка запросов Xpath для использования функции не обязательно, можно воспользоваться опцией браузера копировать Xpath. Если же вы хотите что-то уточнить, я с радостью помогу!
Облачные сервисы не требуют установки на ПК. Все данные хранятся на серверах разработчиков, вы скачиваете только результат парсинга. Доступ к программному обеспечению осуществляется через веб-интерфейс или по API.
Что значит ошибка перенос в excel
Добавить список url можно вручную, XLSX-файлом или ссылкой на XML-карту сайта. Отчеты выгружаются в форматах HTML и XLSX. Первые 500 запросов — бесплатно. Все нюансы работы с инструментом мы описали в гайде.
Открыв, RSS ленту своего сайта видишь, что ленты нет, а браузер сообщает об ошибке. Как мне удается вернуть «на место», «отвалившуюся» RSS ленту я и расскажу дальше.
Примечание: Хочу поправиться и замечу, что неисправности фида не валятся с неба. Скорее всего, это результат установки нового плагина или ваше изменение, некоторых файлов в шаблоне. Так как, для формирования фида используется язык разметки XML, который имеет строгие правила синтаксиса, то любое изменение в файлах, которые не влияют на работу сайта, могут «отстегнуть» RSS.
Для исправления ошибки, я обычно делаю следующие шаги, причем исправление фида может произойти на любом шаге.
Примечание: Вообще эта синтаксическая ошибка называется ошибка разбора XML или XML Parsing Error. В разных браузерах она показывается по-разному. Например, в Chrome:
Предположительно, ошибка разбора появляется из-за пробельных символов (пробел, новая строка, табуляция) появившихся в коде WordPress перед декларацией XML.
Для начала, попытаемся устранить ненужные пробелы в коде
Не помогло, или не хочется лазить по коду, воспользуйтесь плагином: Fix RSS Feed WordPress. Хоть и плагин не протестирован на версии 3.8, вполне может помочь в восстановлении ленты RSS.
Данный плагин не обновлялся 2 года. Скорее всего, он уже не поддерживается и может быть несовместим с текущими версиями WordPress.
Плагин установите на сайт любым из способов установки плагинов. После активации плагина, откройте его и запустите процесс исправления. Если проблема неработающего канала RSS в лишних пробелах, этот плагин должен помочь.
Если плагин Fix RSS Feed WordPress не помог, возможен конфликт одного из плагинов. Попробуйте, отключать в Консоли → Плагины → Установленные, последовательно каждый активный плагин, проверяя работоспособность ленты RSS.
Ошибки будут подсвечены желтым цветом. Ошибки связанные не с синтаксисом файлов, нужно решать для каждого конкретного случая отдельно.
Похожие посты:
Это ведь уже не про RSS? по крайней мере убирать пробелы не помогло
По вопросу я не понял, после чего была такая ошибка.
Вероятно вы что-то импортируйте (контент, товары) при помощи плагина импорта.
Если плагин импорта тестирован на вашей версии, я бы сначала отключил другие плагины сайта и повторил импорт.
Если бы это не помогло, написал в suport хостинга.
Добавить комментарий Отменить ответ
Мнение эксперта
Знайка, самый умный эксперт в Цветочном городе
Если у вас есть вопросы, задавайте их мне!
Задать вопрос эксперту
Предположительно, ошибка разбора появляется из-за пробельных символов пробел, новая строка, табуляция появившихся в коде WordPress перед декларацией XML. Если же вы хотите что-то уточнить, я с радостью помогу!
Я продолжаю получать сообщение об ошибке. Это ошибка
Не уверен, что это подходящее место для этого или нет, если нет, я извиняюсь. Изначально продолжал подниматься, когда я был на ebay, теперь случается случайным образом.
Исправить ошибку Parser конфигурации
Бесплатная версия ограничена 500-ми url. В платной (лицензию можно купить на год) количество страниц для парсинга не ограничено, и она имеет гораздо больше возможностей. Среди них — парсинг цен, названий и описаний товаров с любого сайта. Как это сделать, мы подробно описали в гайде.
В статье:
- 1 Ошибки импорта из Excel и их решения.
- 1.1 Что значит ошибка перенос в excel
- 2 Ошибка разбора XML или XML Parsing Error в RSS-ленте, решения проблемы
- 2.1 Поиск – Ошибка разбора XML или XML Parsing Error в RSS-ленте
- 2.1.1 Похожие посты:
- 2.2 2 комментария к “Ошибка разбора XML или XML Parsing Error в RSS-ленте, решения проблемы”
- 2.2.1 Добавить комментарий Отменить ответ
- 2.3 Исправить ошибку Parser конфигурации
- 2.1 Поиск – Ошибка разбора XML или XML Parsing Error в RSS-ленте
Сбербанк Онлайн не загружает электронный реестр с зарплатными ведомостями
СББОЛ не производит импорт нашей зарплатной ведомости, мотивируя тем, что файл имеет якобы недопустимый формат и сообщает :»ошибка парсинга xml документа (строка: 2 , столбец: 472). Кто нибудь сталкивался с такой проблемой? 🤯
Этот Сбербанк, который «Всегда рядом» (их девиз!), не может мне помочь своей техподдержкой (которой не дождаться, т.к. все операторы всегда заняты) с декабря прошлого года. И обидно каждый раз перед выплатой зарплаты вручную набирать в этом СББОЛе список сотрудников получателей — полностью ФИО и 20 значный лицевой счет каждого !!!🤦♀️
И это при том, что у них в СББОЛ есть все данные по нашим сотрудникам. Неужели нельзя оттуда вставлять реквизиты при заполнении ?!
ООО на УСНО.
Заполнить и подать уведомление об исчисленных суммах налогов и взносов
Цитата (бухгалтер УК):импорт нашей зарплатной ведомости
В какой программе формируете?
Цитата (бухгалтер УК):«ошибка парсинга xml документа (строка: 2 , столбец: 472).
Возможно, это связано с версией установленного у вас Парсера.
ЗЫ: под парсингом подразумевается процесс поиска определенной информации в большом фрагменте текста, а так же разбиение данных на смысловые части.
Формируем в 1С Предприятие 8.3 (не в ЗУПе)
Цитата (бухгалтер УК):СББОЛ не производит импорт нашей зарплатной ведомости, мотивируя тем, что файл имеет якобы недопустимый формат и сообщает :»ошибка парсинга xml документа (строка: 2 , столбец: 472). Кто нибудь сталкивался с такой проблемой?
Этот Сбербанк, который «Всегда рядом» (их девиз!), не может мне помочь своей техподдержкой (которой не дождаться, т.к. все операторы всегда заняты) с декабря прошлого года. И обидно каждый раз перед выплатой зарплаты вручную набирать в этом СББОЛе список сотрудников получателей — полностью ФИО и 20 значный лицевой счет каждого !!!
И это при том, что у них в СББОЛ есть все данные по нашим сотрудникам. Неужели нельзя оттуда вставлять реквизиты при заполнении ?!
ООО на УСНО.
Скорее всего вы загружаете правильный файл в неправильном месте. Еще раз внимательно прочитайте инструкцию.
Заполняйте платежки с актуальными на сегодня КБК, кодами дохода и другими обязательными реквизитами
Здравствуйте.
Как выгружаете из 1С? Через обработку Импортэкспорт по лицевым счетам сотрудников?
Загружаете как? В сбербанке Дополнительно — Обмен с 1С — Импорт — Электронный реестр. Загружаете. Так? Здесь ошибка выходит?
И в каком формате файл: xml или dbf?
Напишите еще релиз и название конфигурации.
Здравствуйте еще раз! Структура файла им не нравится. Кодировка должна быть Windows и еще кое-что не так. А выгружаем в правильном месте Всем спасибо, техподдержка прислала подробный ответ для наших специалистов, пусть думают. Удачи всем в работе!
Вы к изначальной ссылке вида
link = 'https://habr.com/ru/top/page2/'
дописываете counter
res = req.get(link + str(counter))
в итоге получаете 404 для адреса:
'https://habr.com/ru/top/page2/2'
Меняйте номер страницы в goParse()
:
def goParse():
titles, links, times, hyperlinks = [], [], [], []
page_num = 2
while True:
print(page_num)
res = requests.get(f'https://habr.com/ru/top/page{page_num}/')
html = BeautifulSoup(res.text, 'lxml')
times += html.find_all('span', class_='post_time')
links_a = html.find_all('a', class_='post__title_link')
page = html.find_all('a', id='next_page')
for a in links_a:
hyperlinks.append(make_Hyperlink(a.text, a['href']))
if page == 'None':
break
else:
page_num += 1
print(hyperlinks)
PS page_num
должен начинаться с 2
UPD запуск goParse()
с while page_num < 5
: (страницы 2-4) отдает hyperlinks
с 38 ссылками/тайтлами:
[
'=HYPERLINK("https://habr.com/ru/post/538870/", "Кодирование Рида-Соломона для чайников" )',
'=HYPERLINK("https://habr.com/ru/company/audiomania/blog/540612/", "Что послушать, когда пишешь код: бесплатные миксы, заглушка для второго монитора и эмбиент-плеер" )',
'=HYPERLINK("https://habr.com/ru/post/541322/", "Author.today — пираты под флагом копирайта?" )', '=HYPERLINK("https://habr.com/ru/company/itelma/blog/540784/", "Тренды 2021 в индустрии полупроводников" )',
...
'=HYPERLINK("https://habr.com/ru/post/540130/", "Скромное обаяние конспирологии" )',
'=HYPERLINK("https://habr.com/ru/post/541330/", "[приглашение] Запись саундтреков в жанре киберпанк для OSINT инструмента" )',
'=HYPERLINK("https://habr.com/ru/company/rostelecom/blog/541208/", "Как мы автоматизировали тестирование верстки сайта с помощью скриншотов" )'
]
Импорт файла CSV может быть неприятным. Мы все боролись с импортом и повторным импортом файла, который все еще содержит надоедливые, трудно идентифицируемые проблемы. Хотя ошибки импорта CSV могут сильно различаться, мы заметили, что люди, вероятно, будут сталкиваться с одной и той же горсткой ошибок синтаксического анализа CSV снова и снова. Если вы научитесь выявлять и устранять эти ошибки, импорт данных может занять значительно меньше времени и энергии… чего мы все хотели бы иметь больше.
Мы здесь, чтобы помочь, используя как пять советов ниже, так и наш удаленный браузер для файлов CSV в облаке. CSV Studio предлагает надежный синтаксический анализатор и автоматическое исправление ошибок для несовместимых и плохо отформатированных файлов CSV. Он позволяет удаленно просматривать файлы на сервере данных, автоматически выявлять и исправлять ошибки и экспортировать файл в базу данных без ошибок синтаксического анализа. Смотрите демонстрации, чтобы узнать больше.
# 1 — Нераспознанный Юникод / недопустимая кодовая точка
Даже если это не самая распространенная проблема, это определенно первая проблема, с которой вы можете столкнуться при работе с CSV. Если вы используете python для обработки данных, эта проблема проявится очень быстро, поскольку ввод-вывод python вызовет исключение при первых признаках проблемы. Многие парсеры не могут отображать или обрабатывать текстовое поле с недопустимым кодом, и вы вынуждены немедленно найти правильную кодировку, прежде чем пытаться выполнить любую дальнейшую диагностику.
Утилита, такая как команда «file -e», может работать, если для работы достаточно кодовых точек. Имейте в виду, что даже несмотря на то, что большая часть Интернета и персональных компьютеров принимает кодировку UTF-8 по умолчанию как должное, ISO-8859 Latin-1 так же хорош, как и любой другой, для данных, происходящих из базы данных.
# 2 — Текстовое поле с неэкранированным разделителем
Если разделитель столбцов отображается в текстовом поле без экранирования, это приведет к тому, что в строке появится дополнительный столбец. Обычно проблема возникает, когда в CSV-файле не используются двойные кавычки для заключения текстовых и числовых полей. Имена и адреса часто являются результатом ввода с клавиатуры, что означает, что они могут содержать все виды управляющих символов: /, , |, ^, стрелки влево и вправо, возврат каретки, перевод строки и т. Д.
Рациональное решение — повторно экспортировать файл, заключив столбцы в двойные кавычки. Если это невозможно и возникает необходимость удалить лишние разделители, использование CSV Studio для исключения лишних разделителей может помочь вам сохранить рассудок.
# 3 — Строка в кавычках с неэкранированными двойными кавычками
Многие файлы CSV принимают разумные меры предосторожности, заключающие весь текст в кавычки. Неэкранированные двойные кавычки становятся потенциальной проблемой.
Случайное использование DJ ”S вместо DJ’S создает единственную проблему в файле с 600 000 строками. Эта проблема является фатальной: остальная часть файла отображается как одна строка. Наилучший подход — повторно экспортировать файл CSV и правильно избегать двойных кавычек. Если это необходимо сделать после того, как это произошло, в CSV Studio есть алгоритм для поиска лишних двойных кавычек, которые нужно экранировать.
# 4 — Нестандартные escape-символы
Файлы в стиле Unix часто используют обратную косую черту () внутри строк в кавычках, чтобы избежать разделителя строк.
›« В этой строке есть »
Однако вместо использования обратной косой черты CSV-файлы RFC-4180 удваивают разделитель строк в качестве механизма выхода.
›« В этой строке есть «» »
При кодировании файлов CSV следует последовательно применять один из этих механизмов выхода. Однако иногда встречаются файлы, в которых одновременно используются оба метода выхода. Это создает двусмысленность всякий раз, когда встречается escape-последовательность (см. Таблицу).
# 5 — Окончания строк CRLF / Dos
Концы строк не являются проблемой для CSV. Окончания строк в Windows и Unix различаются, и это, конечно, повлияет на файлы данных так же, как и на любой другой файл. Официальный разделитель строк RFC 4180 для CSV — это последовательность CRLF (символ возврата каретки, за которым следует символ новой строки). При обработке файла CSV с окончанием строки CRLF нередко обнаруживается нежелательный символ ^ M (или CR) в конце каждой строки. Это может даже вызвать проблемы с некоторыми парсерами CSV. Обработка файла с помощью утилиты dos2unix — стандартный способ решения этой проблемы.
У вас есть действительно плохой файл CSV, которым вы хотите поделиться? Заинтересованы в простом способе отображения и исправления этих проблем без использования самодельных сценариев регулярных выражений? Прочтите этот пост, посетите сайт или электронную почту.
Всем привет! Сегодня я хочу Вам рассказать, как бороться может не со столь популярной, ошибкой парсинга в php xml документе. Но если честно, то ошибка очень интересная, решал я ее по просьбе заказчика с фриланса, и вот решил рассказать вам, чтобы если что, то знали как бороться.
В какой стороне ошибка я точно сказать немогу, это может быть, как и сторона php так и его модуля simplexml по работе с xml php. Ошибка заключается в том, что если в xml документе есть объекты, названия которых содержат «-» (знак тире), то из php обратится к ним не получится, и даже ошибка не высветится. Лучше покажу вам xml документ, так будет наглядней.
<messages> <message> <transaction-id>768765324</transaction-id> <time>19-11-2004 12:34:34.123</time> <keyword>KEYWORD</keyword> <provider>bee</provider> <short-number>8881</short-number> <phone>79161234567</phone> <text>PRIVET VSEM!</text> <money>1.36</money> <region-id>1</region-id> </message> </messages>
Как видим из кода выше, объекты содержат тире, например: transaction-id, short-number, region-id. Кстати говоря, этот xml какой-то платежной системы или биллинга. Руки бы оторвал за такое.
Теперь, когда нам известна ошибка можно перейти к решению проблемы, а именно, использовать xpath при выборке данных + проявить смекалку. Следующий код это демонстрирует.
$messages = simplexml_load_file('transactions.xml'); $transaction='transaction-id'; $short='short-number'; $region='region-id'; foreach($messages->xpath('/messages/message') as $item){ echo "<p>". $item->time. "</p>"; echo "<p>". $item->$transaction."</p>"; echo "<p>". $item->text. "</p>"; echo "<p>". $item->keyword. "</p>"; echo "<p>". $item->provider. "</p>"; echo "<p>". $item->$short. "</p>"; echo "<p>". $item->phone. "</p>"; echo "<p>". $item->money. "</p>"; echo "<p>". $item->$region. "</p>"; }
Как видим из кода, мы поместили названия проблемных объектов в переменные и потом подставляем название переменных в нужном месте. В принципе, ничего сложного нет и можно всегда пользоваться таким способом, но просто, зачем делают такую структуру документа, непонятно.
На этом все. С 5 июля я в отпуске и меня не будет 3 недели, так что посты продолжу писать по приезду.
php
Ошибки импорта из Excel и их решения.
Раздел Импорт из Excel – предназначен для загрузки текстовых данных о товарах и услугах компании в формате XLS, XLSX, CSV.
Это может быть файл созданный по нашему шаблону для импорта, или же, к примеру, файл экспортированый с другого сайта в формате XLS, XLSX, CSV.
Рассмотрим ошибки в файле импорта, которые чаще всего допускают пользователи и решения для корректировки.
Сообщение об ошибке » В выбранном файле не все обязательные поля или файл поврежден». Как это решить?
1. Возможно, при создании файла импорта, используя наш шаблон, были допущены ошибки. В шаблоне импорта первая строка файла это подсказки, а в файле импорта первой строкой должны идти названия колонок. Нужно удалить первую строку с подсказками перед сохранением заполненного файла:
2. Ошибка возникает при попытке загрузить файл не в формате xls, xlsx или csv при импорте из Excel. Измените расширение импортируемого файла.
Если файл создан в результате экспорта с другого сайта проверьте его на соответствие с нашим шаблоном и наличием обязательных полей/колонок в файле Excel. Посмотреть правила составления файла Excel можно в Кабинете компании — Товары и Услуги — Импорт из Excel
3. Формат одной или нескольких ячеек выбран не верно. Например, в колонке ЦЕНА значение должно быть числовое и целое:
4. Если файл импорта был создан не из нашего шаблона тогда ошибка может быть из-за отсутствия или неверного заполнения поля колонок Адрес_подраздела и Идентификатор_подраздела. Если файл импорта создан из шаблона, импорт происходит даже если эти поля пустые.
После импорта отсутствуют фото к товару , хотя он были в файле импорта. Почему?
Причин, почему в результате импорта картинка не отобразилась, может быть несколько. Если это не связано с настройками импорта, то причину можно найти в файле импорта.
1. В файле импорта не указаны URL для изображений. Для импорта из Excel это колонка Ссылка_изображения. Ссылки должны быть разделены запятыми с пробелами:
Проверьте наличие ссылки в строке товара в колонке для фото, возможно там пустая строка или ссылка картинки указана с ошибкой, не полностью.
2. Также нужно проверить доступность ссылки, если это ссылка на картинку с сайта — скопируйте её и вставьте в строку браузера. Перейдите по адресу ссылки — если картинка отображается — адрес ссылки корректный.
Импорт прошел и у всех товаров теперь статус «Наличие не известно». Почему?
Для обозначения статуса наличия в колонке Наличие применяется:
Если оставить поле наличия пустым — статус вашего товара станет Наличие не известно.
Не отобразилась скидка после импорта. В чем причина?
Колонка Скидка должна иметь процентное или числовое значение, если в этой колонке (или ячейке) значение было указано не % или число — скидка не отобразится. На примере изображения ниже преобразуйте ячейки колонки Скидка в нужный формат:
В файле импорта были заполнены характеристики, но в карточке товара они оказались в Дополнительном. Почему?
На сайте компании и на портале Основные характеристики могут выступать фильтрами при поиске, а Дополнительные характеристики просто отображаются в описании к товару списком.
Если были указаны характеристики, но после импорта они отражаются в Дополнительных, значит для Рубрики, к которой относится товар, нет такой характеристики в нашей базе и система перенесла эти атрибуты в дополнительные.
Мнение эксперта
Знайка, самый умный эксперт в Цветочном городе
Если у вас есть вопросы, задавайте их мне!
Задать вопрос эксперту
Знание языка запросов Xpath для использования функции не обязательно, можно воспользоваться опцией браузера копировать Xpath. Если же вы хотите что-то уточнить, я с радостью помогу!
Облачные сервисы не требуют установки на ПК. Все данные хранятся на серверах разработчиков, вы скачиваете только результат парсинга. Доступ к программному обеспечению осуществляется через веб-интерфейс или по API.
Что значит ошибка перенос в excel
Добавить список url можно вручную, XLSX-файлом или ссылкой на XML-карту сайта. Отчеты выгружаются в форматах HTML и XLSX. Первые 500 запросов — бесплатно. Все нюансы работы с инструментом мы описали в гайде.
Ошибка разбора XML или XML Parsing Error в RSS-ленте, решения проблемы
Открыв, RSS ленту своего сайта видишь, что ленты нет, а браузер сообщает об ошибке. Как мне удается вернуть «на место», «отвалившуюся» RSS ленту я и расскажу дальше.
Примечание: Хочу поправиться и замечу, что неисправности фида не валятся с неба. Скорее всего, это результат установки нового плагина или ваше изменение, некоторых файлов в шаблоне. Так как, для формирования фида используется язык разметки XML, который имеет строгие правила синтаксиса, то любое изменение в файлах, которые не влияют на работу сайта, могут «отстегнуть» RSS.
Для исправления ошибки, я обычно делаю следующие шаги, причем исправление фида может произойти на любом шаге.
Примечание: Вообще эта синтаксическая ошибка называется ошибка разбора XML или XML Parsing Error. В разных браузерах она показывается по-разному. Например, в Chrome:
Поиск – Ошибка разбора XML или XML Parsing Error в RSS-ленте
Предположительно, ошибка разбора появляется из-за пробельных символов (пробел, новая строка, табуляция) появившихся в коде WordPress перед декларацией XML.
Для начала, попытаемся устранить ненужные пробелы в коде
Не помогло, или не хочется лазить по коду, воспользуйтесь плагином: Fix RSS Feed WordPress. Хоть и плагин не протестирован на версии 3.8, вполне может помочь в восстановлении ленты RSS.
Данный плагин не обновлялся 2 года. Скорее всего, он уже не поддерживается и может быть несовместим с текущими версиями WordPress.
Плагин установите на сайт любым из способов установки плагинов. После активации плагина, откройте его и запустите процесс исправления. Если проблема неработающего канала RSS в лишних пробелах, этот плагин должен помочь.
Если плагин Fix RSS Feed WordPress не помог, возможен конфликт одного из плагинов. Попробуйте, отключать в Консоли → Плагины → Установленные, последовательно каждый активный плагин, проверяя работоспособность ленты RSS.
Ошибки будут подсвечены желтым цветом. Ошибки связанные не с синтаксисом файлов, нужно решать для каждого конкретного случая отдельно.
Похожие посты:
2 комментария к “Ошибка разбора XML или XML Parsing Error в RSS-ленте, решения проблемы”
Это ведь уже не про RSS? по крайней мере убирать пробелы не помогло
По вопросу я не понял, после чего была такая ошибка.
Вероятно вы что-то импортируйте (контент, товары) при помощи плагина импорта.
Если плагин импорта тестирован на вашей версии, я бы сначала отключил другие плагины сайта и повторил импорт.
Если бы это не помогло, написал в suport хостинга.
Добавить комментарий Отменить ответ
Мнение эксперта
Знайка, самый умный эксперт в Цветочном городе
Если у вас есть вопросы, задавайте их мне!
Задать вопрос эксперту
Предположительно, ошибка разбора появляется из-за пробельных символов пробел, новая строка, табуляция появившихся в коде WordPress перед декларацией XML. Если же вы хотите что-то уточнить, я с радостью помогу!
Я продолжаю получать сообщение об ошибке. Это ошибка
Не уверен, что это подходящее место для этого или нет, если нет, я извиняюсь. Изначально продолжал подниматься, когда я был на ebay, теперь случается случайным образом.
Исправить ошибку Parser конфигурации
Бесплатная версия ограничена 500-ми url. В платной (лицензию можно купить на год) количество страниц для парсинга не ограничено, и она имеет гораздо больше возможностей. Среди них — парсинг цен, названий и описаний товаров с любого сайта. Как это сделать, мы подробно описали в гайде.
Как исправить ошибку (парсим xls)?
Добрый день! Есть задача распарсить xls. Все вроде хорошо и не раз уже такое делал , пользуюсь библиотекой apache.poi .
Три строчки кода
И тут выпадает эксепшен:
«Exception in thread «main» java.lang.RuntimeException: Unexpected missing row when some rows already present»
Я примерно понимаю в что xls необычный и есть вырезанные ячейки, совмещенные ячейки/строки, но не понимаю как побороть данную ошибку.
- Вопрос задан более трёх лет назад
- 552 просмотра
ну а как обычно борят? Джава же данные не родит, если их там нет
отсеивайте проблемные строки, разбирайте вручную
Обычно . хм . наверное хияк-хияк )
А что значит проблемная строка ?
Полный эксепшен
Exception in thread «main» java.lang.RuntimeException: Unexpected missing row when some rows already present
at org.apache.poi.hssf.usermodel.HSSFSheet.setPropertiesFromSheet(HSSFSheet.java:211)
at org.apache.poi.hssf.usermodel.HSSFSheet.(HSSFSheet.java:136)
at org.apache.poi.hssf.usermodel.HSSFWorkbook.(HSSFWorkbook.java:355)
at org.apache.poi.hssf.usermodel.HSSFWorkbook.(HSSFWorkbook.java:400)
at org.apache.poi.hssf.usermodel.HSSFWorkbook.(HSSFWorkbook.java:381)
at odsPars.main(odsPars.java:10)
Он указывает что ошибка в этой строке
HSSFWorkbook xlsxFile = new HSSFWorkbook(new FileInputStream(«../отчет.xls»));
Источник
Ошибка во время парсинга excel файла что это значит
Itsys |
|
||
Эксперт Профиль Репутация: 1 Требуется импортировать данные из Excel файлов в таблицу MS SQL Надо сделать импорт в эту таблицу произвольного Excel файла (структура может меняться, т.е. набор и количество колонок не постоянно) определенных колонок, т.е. не все подряд, а только допустим 3, 4 и 12 в соответствующие колонки таблицы MS SQL, т.е. 3 колонка в Col3, 4 в Col4, 12 в Col12 и начиная с определенной строки, например с 20 и до конца. Все осложняется тем, что может быть задан произвольный фильтр парсинга, например 4 колонка больше 60, соответственно загружаются все строки, у которых значение в четвертой колонке больше 60, фильтров может быть несколько. Второе больше не усложнение, а условие — файл Excel находится на другом сервере в сети и доступен через шару. PS Данный механизм реализован на Perl, т.е. perl парсит Excel файл и с помошью запросов вставляет это в таблицу, но работает все это очень медлено файл Excel на 16000 строк и 20 колонок парсится около 1-2 минут. Загрузка процессора под 100%, весь отжирается памяти примерно вес файла *3 и загружается сеть, т.к. perl стоит там же, где лежит Excel — на другом сервере. Загрузку файла на 50000 строк, я так и не дождался — обрубил. ЗЫ Самый главный вопрос, если это реализовать средствами MS SQL, если это, конечно, впринципе возможно, будет ли это работать быстрее и меньше грузить процессор, память и сеть? |
|||
|
Советчик
Профиль
Группа: Модератор
Сообщений: 20507
Регистрация: 8.4.2004
Где: Зеленоград
Репутация: 25
Всего: 453
О(б)суждение моих действий — в соответствующей теме, пожалуйста. Или в РМ. И высшая инстанция — Администрация форума.
Akina |
|
||
|
Опытный
Профиль
Группа: Участник
Сообщений: 418
Регистрация: 23.1.2008
Где: Московская област ь
Репутация: 10
Всего: 17
Magnifico |
|
||
Код |
Select * From Openrowset(‘msdasql’,’DRIVER=;ReadOnly=1;DefaultDir=c:filesnames.xls’, ‘Select * From [sheet1$]’) |
Шустрый
Профиль
Группа: Участник
Сообщений: 125
Регистрация: 25.6.2007
Где: UA
Репутация: 2
Всего: 5
SharedNoob |
|
||
|
Itsys |
|
|||||||
Эксперт Профиль Репутация: 1
Потому-что это используется в интернет-магазине, написанном на perl, а файл Excel — это прайсы поставщиков, которые загружаются, сверяются с существующими товарами поставщика, корректируются цены и д.р. параметры товаров в магазине и добавляются новые — нет возможности добавить в Excel доп обработчики, т.к. файлы не наши, и обяснять как это делать каждому менеджеру после получения файла, собственно говоря не хочется
У нас 2000 и пока никаких причин, чтобы покупать 2005 нет, хотя это может стать причиной, вопрос в скорости работы. насколько быстро данный запрос откроет файл на 10 мегов? Добавлено через 2 минуты и 2 секунды
Вообще не выход, т.к.
Какие колонки импортировать а какие нет — определяет менеджер при импорте, и файлы у всех поставщиков очень уж разные |
||||||||
|
Опытный
Профиль
Группа: Участник
Сообщений: 418
Регистрация: 23.1.2008
Где: Московская област ь
Репутация: 10
Всего: 17
Magnifico |
|
||
|
Шустрый
Профиль
Группа: Участник
Сообщений: 125
Регистрация: 25.6.2007
Где: UA
Репутация: 2
Всего: 5
SharedNoob |
|
||
Цитата(Magnifico @ 13.3.2008, 14:04) |
для 2005 open rowset |
Код |
Select * From Openrowset(‘msdasql’,’DRIVER=;ReadOnly=1;DefaultDir=c:filesnames.xls’, ‘Select * From [sheet1$]’) |
Дык а чем не устраивает это ? возвращает набор данных который лежит в ексель файле . да дальше вороти-нехачу .
Добавлено @ 15:18
ой извеняюсь, недочитал . sql2005
ДЛЯ SQL 2000
вариант 1
Код |
SELECT * FROM OPENDATASOURCE( ‘Microsoft Excel Driver (*.xls)’, ‘Data Source=D: ;’ ). [название файлла без расширения] |
Код |
SELECT * FROM OPENROWSET (‘MSDASQL’, ‘Driver=; SourceDB=d:; DefaultDir=d:; SourceType=XLS; Exclusive=No; BackgroundFetch=Yes; Collate=Russian; Null=No; Deleted=No;’, ‘SELECT * FROM [название файлла без расширения]’) |
код на работоспособность не проверял но с драйвером для DBF все пашет
Это сообщение отредактировал(а) SharedNoob — 13.3.2008, 15:27
Itsys |
|
||
Эксперт Профиль Репутация: 1 А DefaultDir можно задать как \serverfiles? Это сообщение отредактировал(а) Itsys — 13.3.2008, 15:42 |
|||
|
Шустрый
Профиль
Группа: Участник
Сообщений: 125
Регистрация: 25.6.2007
Где: UA
Репутация: 2
Всего: 5
QA => F1 => поиск по указателю => OPENDATASOURCE (или OPENROWSET) => enter
и читаем.
ps
для начала прочитайте данные с локального компьютера, а потом можно и подключить сетевой диск если что.
Это сообщение отредактировал(а) SharedNoob — 13.3.2008, 15:54
SharedNoob |
|
||
|
Itsys |
|
||
Эксперт Профиль Репутация: 1
До этого я сам догадался . Спасибо что напомнил, что есть такая функция в MS SQL (шутка). Ладно протестирую сообщу результаты. Это сообщение отредактировал(а) Itsys — 13.3.2008, 16:09 |
|||
|
Itsys |
|
|||||
Эксперт Профиль Репутация: 1
Только парсит он не правильно
Почему некоторые значения изменены на NULL? |
||||||
|
Опытный
Профиль
Группа: Участник
Сообщений: 418
Регистрация: 23.1.2008
Где: Московская област ь
Репутация: 10
Всего: 17
Могут разные тиы данных в одном столбце:
1
2
3
4
5
6
7А
7A это потенциальный нулл — ошибка преобразования
если не принципиальны типы данных: приводить столбцы эксель к строке
Magnifico |
|
||
Код |
Sub ПривестиКСтроке() Dim temp As String Dim str As String str = «‘» For Each c In Selection temp = Trim(c.Value) |
c.Value = str & temp
Next c
End Sub
Itsys |
|
||
Эксперт Профиль Репутация: 1
Есть друие предложения и варианты? PS хотелось бы сделать все без вмешательства пользователей — получил файл по почте — загрузил в back-office интернет-магазина и все — дальше система сама все обрабатывет, менеджеру надо только подтверждать выполнение определнных действий.. |
|||
|
Опытный
Профиль
Группа: Участник
Сообщений: 418
Регистрация: 23.1.2008
Где: Московская област ь
Репутация: 10
Всего: 17
попробуй с cast(ПОЛЕ as nvarchar(255)) поиграться
Magnifico |
|
||
Код |
select [ЗДЕСЬ] from openrowset( ‘MSDASQL’, ‘Driver=Microsoft Excel Driver (*.xls);DBQ=\pavlovFiles34’, ‘SELECT [ИЛИ ЗДЕСЬ] FROM [LIST$]’ ) as xls |
если использовать эксель в качестве источника данных ADO ,OLE то полюбому будет приводится столбец к определенному типу данных
(которых больше в столбце) и будут ошибки преобразования.
Только банально перебирать столбцы и строки и приводить каждую ячейку к определн формату
для обработки грязных юзерских данных может и понадобится сложные обработчики писать и не в SQLSERVERE
да и ресурсоемкое это занятие
Itsys |
|
||
Эксперт Профиль Репутация: 1 Проблема только в том, что исходный файл произвольный, т.е. изначально не известно даже сколько колонок в файле, заголовки полей моут стоять в любой строке файла — моут в первой, а могут и в 20, так как в приведенном выше примере, и, первым делом чего я хочу сделать, так это получить хотябы список полей, а он мне вместо заголовка поля выдает NULL. Есть ли способ CASTить все поля запроса в VARCHAR без их конкретного указания, ну типа CAST(* AS VARCHAR(5000))? |
|||
|
Beltar |
|
||
Опытный Профиль Репутация: нет |
|||
|
Опытный
Профиль
Группа: Участник
Сообщений: 418
Регистрация: 23.1.2008
Где: Московская област ь
Репутация: 10
Всего: 17
есть еще опции HDR=Yes;IMEX=1;
«HDR=Yes; считает первую строку заголовком полей
«IMEX=1;» интерпретирует данные как текст
Magnifico |
|
||
|
Опытный
Профиль
Группа: Участник
Сообщений: 418
Регистрация: 23.1.2008
Где: Московская област ь
Репутация: 10
Всего: 17
используй лучше оле дб он покорректней работает
Magnifico |
|
||
Код |
select * from openrowset(‘Microsoft.Jet.OLEDB.4.0’ , ‘Excel 8.0; HDR=YES; IMEX=1;Database=C:my.xls’ , [sheet1$]) |
Select *
FROM OPENDATASOURCE(‘Microsoft.Jet.OLEDB.4.0’, ‘Data Source=C:my.xls;
Extended Properties=»Excel 8.0;HDR=Yes;»‘). [sheet1$]
Itsys |
|
||
Эксперт Профиль Репутация: 1 Beltar, Обработка на perl уже написана, толь проблема в том, что грузится очень долго, вот и ищу возможность быстрее обработать данные. |
|||
|
Itsys |
|
||
Эксперт Профиль Репутация: 1 |
|||
|
Опытный
Профиль
Группа: Участник
Сообщений: 418
Регистрация: 23.1.2008
Где: Московская област ь
Репутация: 10
Всего: 17
Magnifico |
|
||
Код |
Sub ПеребратьИменаЛистов() Dim XLSFile As String Dim i As Integer i = 1 XLSFile = «C:filesnamesw.xls» |
Dim ws As Worksheet
For Each ws In Worksheets
MsgBox «Имя » & i & » -го листа: » & ws.Name
Debug.Print «Имя » & i & » -го листа: » & ws.Name
i = i + 1
Next ws
End Sub
Itsys |
|
|||
Эксперт Профиль Репутация: 1 Вопрос только в том, как это запустить, а потом еще и желательнов запрос передать. мне сами именя листов не нужны, мне надо выбирать данные из первого листа в файле, может можно это как-нибудь задать не перебирая с помощью VB файл?
|
||||
|
Опытный
Профиль
Группа: Участник
Сообщений: 418
Регистрация: 23.1.2008
Где: Московская област ь
Репутация: 10
Всего: 17
Magnifico |
|
||
Цитата |
Вопрос только в том, как это запустить |
excel -> (alt + F11)(Редактор VB) — > insert ->module ->копироватьКодСюда ->правим пути в коде ->RUN
Ole automation это единственный способ добраться к свойствам и методам Эксель
Все языки программирования интегрируются с Эксель именно так, (и ничего другого кроме вышеприведенного кода не придумаешь)
Никаким запросом имена листов узнать невозможно
Эксель не база данных ,и нет возможности получить Информационную схему
Цитата |
желательно в запрос передать |
Если хочешь помучиться в 2000 есть расширенные хранимые процедуры на c++ (Visual Studio 6 )
(у меня на с++ «аллергия»)
В БОЛЕ набрать OLE Automation там есть какие то методы работы , можно вызывать VBA методы и св-ва (не разбирался)
ищи хороший пример
Или писать прогу на любом языке ,опять же интеграция с Эксель(код вверху)
подключение к sql server -> передача параметров из встроенного VBA в хранимую процедуру (с openrowsetoM)
Цитата |
мне надо выбирать данные из первого листа в файле |
Itsys |
|
||
Эксперт Профиль Репутация: 1 В общем решил я отказаться от этой затеи, т.к. срорее всего никакого убыстрения по сравнению с существующей обработкой на Perl я не получу. Еще раз спасибо. |
|||
|
Опытный
Профиль
Группа: Участник
Сообщений: 418
Регистрация: 23.1.2008
Где: Московская област ь
Репутация: 10
Всего: 17
в 2005 это работает:
Magnifico |
|
||
Код |
declare @file_name varchar(255), @h_application int, @hr int,@h_workbook int , @data varchar(255),@source varchar(255),@description varchar(255) |
set @file_name = ‘c:filesserge.xls’
exec @hr = sp_OACreate ‘Excel.Application’, @h_application OUT
exec @hr = sp_OAMethod @h_application, ‘Application.workbooks.Open’, @h_workbook OUT , @file_name
exec @hr = sp_OAGetProperty @h_application, ‘Workbooks(1).Sheets(1).Name’, @data OUT
SELECT @data as [dat]
exec sp_OAMethod @h_application, ‘Quit’
exec @hr=sp_OADestroy @h_application
—set @data =’NewSheet1′;
declare @SQL nvarchar(4000)
set @SQL =
‘SELECT * FROM OPENROWSET(»Microsoft.Jet.OLEDB.4.0»’ +’,’+»’Excel 8.0;HDR=Yes;IMEX=1;Database=C:filesserge.xls»’+’,’+ »’Select * From [‘+ @data +’$]»)’
Itsys |
|
||
Эксперт Профиль Репутация: 1
set @file_name = ‘c:filesserge.xls’ exec @hr = sp_OACreate ‘Excel.Application’, @h_application OUT exec @hr = sp_OAMethod @h_application, ‘Application.workbooks.Open’, @h_workbook OUT , @file_name SELECT @data as [dat] |
Насколько я понимаю, это все работает не очень быстро
Опытный
Профиль
Группа: Участник
Сообщений: 418
Регистрация: 23.1.2008
Где: Московская област ь
Репутация: 10
Всего: 17
Это работает мгновенно!
Получить имя первого листа первой открытой книги- какая же здесь может быть нагрузка
Magnifico |
|
||
Код |
exec @hr = sp_OAGetProperty @h_application, ‘Workbooks(1).Sheets(1).Name’, @data OUT |
я просто незнаю будет ли работать в 2000?
Что то ты рано сдался! Это то что доктор прописал .
Одна тонкость Workbooks(1).Sheets(1).Name -мы получаем имя первого листа первой открытой книги,если будет открыта другая книга,
допустим локально , а потом будет выполнен этот запрос -то подхватит именно эту книгу ,а
Код |
exec @hr = sp_OAMethod @h_application, ‘Application.workbooks.Open’, @h_workbook OUT , @file_name |
будет уже второй.
Из этого следует лучше обращаться к книге по имени (надюсь её название хотя бы известно или тоже скрипт писать ,перебирая все
эксель файлы? )
Код |
Workbooks(«Names.xls»).Sheets(1).Name |
в 2000 OLE Automation должно как то включаться (поиск)
Itsys |
|
||
Эксперт Профиль Репутация: 1
Публиковать ссылки и обсуждать взлом чего бы то ни было.
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, Zloxa, Akina.
[ Время генерации скрипта: 0.2007 ] [ Использовано запросов: 21 ] [ GZIP включён ] Источник Читайте также: Что значит трехсменный график работы Adblock |