К списку форумов К списку тем
Регистрация    Правила    Главная форума    Поиск   
Имя: Пароль:
Рекомендовать в новости

На старом сервере переустановил ОС с 2003 на 2012. Теперь тормозные провалы

0 - 09.09.2016 - 22:32
Остался сервер, которому 5-6 лет, поменяли на новый, пока не стал дохнуть, в этом заменили все диски, батарейку рэйда, добавили памяти и установили Windows 2012 R2 в качестве хоста виртуальных машин.

До этого был Windows Server 2003 и максимально возможные нагрузки (сервер терминалов для 80 пользователей 1С:7.7 при очень активной работе).
Ничего не тормозило.

После указанной модернизации появились "провалы" - когда сервак не реагирует несколько секунд ни на что, кроме движения мыши - ни в самой хост-системе (2012), ни в гостевых виртуалка.

До этого не замечал, потому что там более полугода были только контролеры домена и пр. мелочь, а когда перенёс туда почтовик взамен подыхающего старого - посыпались жалобы, что окно проверки/отправки почты может зависать на 20-30 секунд.

***********************

Мать перепрошита на последнюю версию, RAID (LSI-9260-8i) тоже, все обновления ОС, все последние дрова (правда, дров чипсета под 2012 нет)

Просто совпало и он подыхает своей смертью или что-то известное и лечится?

***********

Supermicro X8DTL-3F
48 Gb RAM
LSI-9260-8i + BBU (Write Back mode ON)
8 SATA HDD Toshiba 3 Tb
Windows 2012 R2 Standard



Гость
1 - 09.09.2016 - 23:47
0-StepanRazin >
Суммарно сколько виртуалок там? Температуры в норме?
2 - 10.09.2016 - 00:14
(1):
Виртуалок 2:
- одна - контроллер домена и сервер Гаранта-Консультанта на 4-5 юзеров
- вторая - почтовый сервер MDaemon.

Свободно 32 гига и 4 ядра.

Температура процов в середине дня около 50 градусов

Отредактировано StepanRazin; 10.09.2016 в 00:15. Причина: 1
Гость
3 - 10.09.2016 - 00:40
2-StepanRazin >
Нагрузки на дисковую подсистему считай вообще нет.
температура мостов и контроллера тоже в норме?
Журналы чистые? Сеть тоже отваливается при зависании?
Гость
4 - 10.09.2016 - 00:42
2-StepanRazin >
Вот такой вариант еще есть, может ваш случай.
5 - 10.09.2016 - 10:14
Да все в норме - журналы, температуры, загрузки процов, память и пр.

Тоже первым делом поменял дрова RAID-а (он у меня не на борту, LSI-9260-8i)

Хоть ОС на 2008 переставляй, блин...
6 - 10.09.2016 - 11:10
Вдогонку - сеть ни при чём, провисания наблюдаются даже в консоли.
Гость
7 - 10.09.2016 - 11:53
Антивирус установлен на хостовой машине?
8 - 10.09.2016 - 14:10
(7): Нет, разумеется!

Попробовал откатить прошивку RAID на более старую, стабильную версию от конца 2014 года, выпущенную ещё LSI, а не AVAGO, который их купил.
Откатил прошивку, драйвер и Management Tool.

Понаблюдаем в понедельник.

Если не прокатит, попробую ещё встроенные в винду дрова.

Но надежды мало, так как у меня много где на LSI-9260 стоит и стабильно работает W2012. Грешу на мать, но поскольку дров чипсета под 2012 не существует, фиг знает...

Отредактировано StepanRazin; 10.09.2016 в 14:11. Причина: очепятки
Гость
9 - 10.09.2016 - 14:37
8-StepanRazin >
Можно еще попробовать переставить сервер. Крайняя мера, но случается и с установкой беда. Или через DISM проверить.
Мне кажется, не в железе дело.
10 - 10.09.2016 - 16:15
Цитата:
Сообщение от Pass Посмотреть сообщение
Можно еще попробовать переставить сервер. Крайняя мера, но случается и с установкой беда.
Если и буду переставлять, то сразу на 2008. Нет желания потом третий раз это делать, тем более, что ни разу ничего подобного не встречалось за сотни установок
Гость
11 - 10.09.2016 - 19:32
10-StepanRazin >
Если под виртуализацию, то стоило бы 2016 подождать. Всяко больше новшеств.
12 - 10.09.2016 - 21:06
Цитата:
Сообщение от Pass Посмотреть сообщение
10-StepanRazin > Если под виртуализацию, то стоило бы 2016 подождать. Всяко больше новшеств.
Мне не надо "новшеств".
Мне надо, чтобы сервер не тормозил.
13 - 10.09.2016 - 21:08
Вдогонку: А уж новые ОС я вообщп рикогда не ставлю, пока пара лет не пройдет и СП не выйдет
Гость
14 - 12.09.2016 - 13:01
По признакам похоже на дисковую подсистему. Бывает у меня похожее на более мощном серваке, когда одновременно попадает на теневое копирование и восстановление sql базы.
Не мдаемон ли тормозит все? под него специфические требования к дисковой подсистеме, при 100+ юзерах ему уже не сата нужны, а сасы.
15 - 12.09.2016 - 15:45
(14): До этого этот же MDaemon стоял на простом онбоардном RAID-1, на простых древних SATA-дисках и все летало.

Так что тормозить 9260-8i со свежей батарейкой и Write-Back он вряд ли может

Откат прошивки и драйвера RAID на стабильную версию 2014 года ничего не дали.

Видимо придётся ставить 2008 и проверять под ним, сконвертировав виртуалки в VHD
Гость
16 - 13.09.2016 - 00:47
Посмотри по ссылкам возможные проблемы и решения
https://support.microsoft.com/ru-ru/kb/3100527
https://support.microsoft.com/ru-ru/kb/2928360
https://support.microsoft.com/ru-ru/kb/2957623
Сам пару лет назад сталкивался в проблемой в последней ссылке.
17 - 13.09.2016 - 07:23
(16): Все обновления, кроме kb2955164 были установлены (это запрашивается по мылу).

Установил, наблюдаем, но не сильно верится в успех уже.
Запланировал на выходные переход на 2008.

ППЦ, у меня это будет первая переустановка свежепоставленной ОС "потому что-то работает не так" лет за 10 уже.
18 - 13.09.2016 - 07:25
Вдогонку - все счётчики постоянно почти в нуле:

Процы - 1-5%
Сеть - 0.1%
Дисковая система - не выше 10 мегабит/сек. и то редко, обычно не более 1 мегабита в сек., и во время провисаний никаких пиков нет.
Гость
19 - 13.09.2016 - 18:00
Софтина для LSI установлена?
Там, в логах, что-нибудь видно?
Странно давать совет такому мэтру, но тем не менее
Когда п.клиенты крутят часиками, пинг к серверу что показывает?
20 - 13.09.2016 - 21:00
(19): Ну, слухи о моей "мэтровости" сильно преувеличены.
Тем не менее, я действительно очень редко обращаюсь с вопросами, потому что их почти не возникает, а те, ответы на которые не знаю или не могу вспоминить, гуглятся.

MegaRAID Storage Manager установлен и вообще никаких настораживающих записей в логах нет.

Лог системы также без замечаний.

Пинг к серверу не пропадает вообще.

Еще раз повторюсь - фризы наблюдаются даже в консоли.

После установки одного патча из (16) попросил юзеров понаблюдать.

Жду отзывов завтра-послезавтра.
Гость
21 - 13.09.2016 - 22:03
20-StepanRazin >
Я так понимаю, мониторинга нет на этом сервере. А что-то из бекапа есть? Может, встроенные средства?
Гость
22 - 13.09.2016 - 22:28
Мдя, про мониторинг я даже заикнуться боялся
Гость
23 - 13.09.2016 - 22:29
>Пинг к серверу не пропадает вообще
ничего не навевает?
Гость
24 - 13.09.2016 - 22:37
22-alexwww >
23-alexwww >
я не въехал(
Гость
25 - 13.09.2016 - 22:45
Дисковая дохнет.
Дальше варианты,
fw контроллера кривая,
fw одного из дисков несоответствующая. Да, "мэтр" про такую хрень дб помнить, используя LSI)
драйвер контроллера
и самое первое и очевидное - физика, провода, интерфейс и питание дисков. Это дб видно в журналах LSI, разувайте глазки
Чудес не бывает.
26 - 13.09.2016 - 22:53
(25): "должен помнить" - это когда проблема часто встречается

У меня сильно за сотню серверов на обслуживании и данная проблема встречается впервые (если не считать "засыхающие матери" в серверах, но этот 3 месяца назад ещё летал на другой ОС, его заранее предусмотрительно поменяли)

Спасибо вам за рекомендацию про "глазки", ваша помощь неоценима
27 - 13.09.2016 - 22:55
(21): Днём, когда наблюдаются провисания, никаких бэкапов нет - ни на хосте, ни на виртуалках.
Гость
28 - 13.09.2016 - 22:59
27-StepanRazin >
смарты винтов? Подкинуть бы к мониторингу и посмотреть на дисковую из него во время провалов.
Гость
29 - 13.09.2016 - 23:02
26, не во что.
Когда плод созреет, не постесняйтесь озвучить)
Гость
30 - 13.09.2016 - 23:10
Ну, и самый тупой вариант, диски не из HW Compatibility List. Но это маловероятно, т.к. "серверов за сотню", и таких проколов быть в принципе не может. Или может?
31 - 14.09.2016 - 07:28
(30): Минимум в десятке других серверов установлено такое же сочетание RAID, дисков и ОС.

Почему на мать с самого начала и грешил - может RAID и мать создают фризы
Гость
32 - 14.09.2016 - 11:47
Таки я голосую за дисковую подсистему.
Счетчики вы озвучили. Кроме очереди на диск во время провалов. Присмотритесь.
33 - 14.09.2016 - 12:21
(32): Уже не посмотреть.

Ощущение, что после установки kb2955164 проблема исчезла, хотя я не понимаю, почему оно не было установлено вместе с остальными при обновлении через Windows Update (при установке ОС в мае 2016 года были установлены все обновления, с многократными перезагрузками и проверками, что ничего больше не осталось).

А может быть просто "затаилась", если верно моё предположение про "высыхающую мать".

Тестируем дальше.

Попросил широковещательным запросом весь офис многократно в течение 5 минут получать-отправлять почту без перерыва. Никаких провисаний пока.
Гость
34 - 14.09.2016 - 12:59
Опираясь на свой опыт, и скудную инфу от Романа, могу только на дисковую грешить. А там уже растаскивать подробности по кубикам.
"добавили памяти" куда? в контроллер или в супермикру?
Подразумевается, но не факт, что MB/RAID/HDD имеют перекрестный сертификат. FW дисков соответствуют FW контроллера, ну и пр. "мелочи"
Замените контроллер, для проверки. Должен же быть у солидного интегратора, один экземпляр на складе, на горячую замену для десятка серверов? Ну, не мне обьяснять тонкости отъема бабла)
35 - 14.09.2016 - 13:05
(34): *оглядывается вокруг*: Где? Где солидный интегратор? krotov с DarkAngel не выступали в этой теме
%о)))
Гость
36 - 14.09.2016 - 13:08
Кгхм,
Цитата:
У меня сильно за сотню серверов на обслуживании
Это про какого-то сопливого босяка, вероятно?
37 - 14.09.2016 - 13:19
(36): Так и есть. И рэйдов таких парочку найду.

Но "солидный интегратор" - это точно не мы %о))
"Солидные интеграторы" обслуживают МТС-Мегафон и пр. компании такого уровня
Гость
38 - 14.09.2016 - 13:29
"Солидный интегратор" измеряется не количеством/наличием Брендов/клиентов в обслуживании, а качеством [*****]..., т.е клиентов может быть и два, но железок на полке, для этих двоих, должно лежать в достатке. Это солидно. А "за сотню серверов" без железок, таки да, просто жадный, и недальновидный ухарь-купец)
39 - 14.09.2016 - 13:57
(38): И вам спасибо за беседу и оценку моей деятельности.

За 13 лет я не потерял ни одного клиента (кроме случаев, когда клиент разорился).

Видимо достаточно качественно обеспечиваю бесперебойность работы, включая тех, кто работает по 24/7/365


К списку вопросов






Copyright ©, Все права защищены