Форум на Kuban.ru (http://forums.kuban.ru/)
-   Сети и их администрирование (http://forums.kuban.ru/f1029/)
-   -   На старом сервере переустановил ОС с 2003 на 2012. Теперь тормозные провалы (http://forums.kuban.ru/f1029/na_starom_servere_pereustanovil_os_s_2003_na_2012_teper-_tormoznye_provaly-7995108.html)

StepanRazin 09.09.2016 22:32

На старом сервере переустановил ОС с 2003 на 2012. Теперь тормозные провалы
 
Остался сервер, которому 5-6 лет, поменяли на новый, пока не стал дохнуть, в этом заменили все диски, батарейку рэйда, добавили памяти и установили Windows 2012 R2 в качестве хоста виртуальных машин.

До этого был Windows Server 2003 и максимально возможные нагрузки (сервер терминалов для 80 пользователей 1С:7.7 при очень активной работе).
Ничего не тормозило.

После указанной модернизации появились "провалы" - когда сервак не реагирует несколько секунд ни на что, кроме движения мыши - ни в самой хост-системе (2012), ни в гостевых виртуалка.

До этого не замечал, потому что там более полугода были только контролеры домена и пр. мелочь, а когда перенёс туда почтовик взамен подыхающего старого - посыпались жалобы, что окно проверки/отправки почты может зависать на 20-30 секунд.

***********************

Мать перепрошита на последнюю версию, RAID (LSI-9260-8i) тоже, все обновления ОС, все последние дрова (правда, дров чипсета под 2012 нет)

Просто совпало и он подыхает своей смертью или что-то известное и лечится?

***********

Supermicro X8DTL-3F
48 Gb RAM
LSI-9260-8i + BBU (Write Back mode ON)
8 SATA HDD Toshiba 3 Tb
Windows 2012 R2 Standard

Pass 09.09.2016 23:47

0-StepanRazin >
Суммарно сколько виртуалок там? Температуры в норме?

StepanRazin 10.09.2016 00:14

(1):
Виртуалок 2:
- одна - контроллер домена и сервер Гаранта-Консультанта на 4-5 юзеров
- вторая - почтовый сервер MDaemon.

Свободно 32 гига и 4 ядра.

Температура процов в середине дня около 50 градусов

Pass 10.09.2016 00:40

2-StepanRazin >
Нагрузки на дисковую подсистему считай вообще нет.
температура мостов и контроллера тоже в норме?
Журналы чистые? Сеть тоже отваливается при зависании?

Pass 10.09.2016 00:42

2-StepanRazin >
Вот такой вариант [url=https://social.technet.microsoft.com/Forums/windowsserver/en-US/e8f5ebed-0f7a-485a-a4e5-8f8ac685eb78/resolved-server-2012-essentials-freezes-and-stops-responding?forum=winserveressentials]еще есть[/url], может ваш случай.

StepanRazin 10.09.2016 10:14

Да все в норме - журналы, температуры, загрузки процов, память и пр.

Тоже первым делом поменял дрова RAID-а (он у меня не на борту, LSI-9260-8i)

Хоть ОС на 2008 переставляй, блин...

StepanRazin 10.09.2016 11:10

Вдогонку - сеть ни при чём, провисания наблюдаются даже в консоли.

Pass 10.09.2016 11:53

Антивирус установлен на хостовой машине?

StepanRazin 10.09.2016 14:10

(7): Нет, разумеется!

Попробовал откатить прошивку RAID на более старую, стабильную версию от конца 2014 года, выпущенную ещё LSI, а не AVAGO, который их купил.
Откатил прошивку, драйвер и Management Tool.

Понаблюдаем в понедельник.

Если не прокатит, попробую ещё встроенные в винду дрова.

Но надежды мало, так как у меня много где на LSI-9260 стоит и стабильно работает W2012. Грешу на мать, но поскольку дров чипсета под 2012 не существует, фиг знает...

Pass 10.09.2016 14:37

8-StepanRazin >
Можно еще попробовать переставить сервер. Крайняя мера, но случается и с установкой беда. Или через DISM проверить.
Мне кажется, не в железе дело.

StepanRazin 10.09.2016 16:15

[quote=Pass;42881090]Можно еще попробовать переставить сервер. Крайняя мера, но случается и с установкой беда.[/quote]

Если и буду переставлять, то сразу на 2008. Нет желания потом третий раз это делать, тем более, что ни разу ничего подобного не встречалось за сотни установок

Pass 10.09.2016 19:32

10-StepanRazin >
Если под виртуализацию, то стоило бы 2016 подождать. Всяко больше новшеств.

StepanRazin 10.09.2016 21:06

[quote=Pass;42882266] 10-StepanRazin > Если под виртуализацию, то стоило бы 2016 подождать. Всяко больше новшеств. [/quote]

Мне не надо "новшеств".
Мне надо, чтобы сервер не тормозил.

StepanRazin 10.09.2016 21:08

Вдогонку: А уж новые ОС я вообщп рикогда не ставлю, пока пара лет не пройдет и СП не выйдет

Flukostat 12.09.2016 13:01

По признакам похоже на дисковую подсистему. Бывает у меня похожее на более мощном серваке, когда одновременно попадает на теневое копирование и восстановление sql базы.
Не мдаемон ли тормозит все? под него специфические требования к дисковой подсистеме, при 100+ юзерах ему уже не сата нужны, а сасы.

StepanRazin 12.09.2016 15:45

(14): До этого этот же MDaemon стоял на простом онбоардном RAID-1, на простых древних SATA-дисках и все летало.

Так что тормозить 9260-8i со свежей батарейкой и Write-Back он вряд ли может

Откат прошивки и драйвера RAID на стабильную версию 2014 года ничего не дали.

Видимо придётся ставить 2008 и проверять под ним, сконвертировав виртуалки в VHD

claw15 13.09.2016 00:47

Посмотри по ссылкам возможные проблемы и решения
[url]https://support.microsoft.com/ru-ru/kb/3100527[/url]
[url]https://support.microsoft.com/ru-ru/kb/2928360[/url]
[url]https://support.microsoft.com/ru-ru/kb/2957623[/url]
Сам пару лет назад сталкивался в проблемой в последней ссылке.

StepanRazin 13.09.2016 07:23

(16): Все обновления, кроме kb2955164 были установлены (это запрашивается по мылу).

Установил, наблюдаем, но не сильно верится в успех уже.
Запланировал на выходные переход на 2008.

ППЦ, у меня это будет первая переустановка свежепоставленной ОС "потому что-то работает не так" лет за 10 уже.

StepanRazin 13.09.2016 07:25

Вдогонку - все счётчики постоянно почти в нуле:

Процы - 1-5%
Сеть - 0.1%
Дисковая система - не выше 10 мегабит/сек. и то редко, обычно не более 1 мегабита в сек., и во время провисаний никаких пиков нет.

alexwww 13.09.2016 18:00

Софтина для LSI установлена?
Там, в логах, что-нибудь видно?
Странно давать совет такому мэтру, но тем не менее
Когда п.клиенты крутят часиками, пинг к серверу что показывает?

StepanRazin 13.09.2016 21:00

(19): Ну, слухи о моей "мэтровости" сильно преувеличены.
Тем не менее, я действительно очень редко обращаюсь с вопросами, потому что их почти не возникает, а те, ответы на которые не знаю или не могу вспоминить, гуглятся.

MegaRAID Storage Manager установлен и вообще никаких настораживающих записей в логах нет.

Лог системы также без замечаний.

Пинг к серверу не пропадает вообще.

Еще раз повторюсь - фризы наблюдаются даже в консоли.

После установки одного патча из (16) попросил юзеров понаблюдать.

Жду отзывов завтра-послезавтра.

Pass 13.09.2016 22:03

20-StepanRazin >
Я так понимаю, мониторинга нет на этом сервере. А что-то из бекапа есть? Может, встроенные средства?

alexwww 13.09.2016 22:28

Мдя, про мониторинг я даже заикнуться боялся

alexwww 13.09.2016 22:29

>Пинг к серверу не пропадает вообще
ничего не навевает?

Pass 13.09.2016 22:37

22-alexwww >
23-alexwww >
я не въехал(

alexwww 13.09.2016 22:45

Дисковая дохнет.
Дальше варианты,
fw контроллера кривая,
fw одного из дисков несоответствующая. Да, "мэтр" про такую хрень дб помнить, используя LSI)
драйвер контроллера
и самое первое и очевидное - физика, провода, интерфейс и питание дисков. Это дб видно в журналах LSI, разувайте глазки
Чудес не бывает.

StepanRazin 13.09.2016 22:53

(25): "должен помнить" - это когда проблема часто встречается

У меня сильно за сотню серверов на обслуживании и данная проблема встречается впервые (если не считать "засыхающие матери" в серверах, но этот 3 месяца назад ещё летал на другой ОС, его заранее предусмотрительно поменяли)

Спасибо вам за рекомендацию про "глазки", ваша помощь неоценима

StepanRazin 13.09.2016 22:55

(21): Днём, когда наблюдаются провисания, никаких бэкапов нет - ни на хосте, ни на виртуалках.

Pass 13.09.2016 22:59

27-StepanRazin >
смарты винтов? Подкинуть бы к мониторингу и посмотреть на дисковую из него во время провалов.

alexwww 13.09.2016 23:02

26, не во что.
Когда плод созреет, не постесняйтесь озвучить)

alexwww 13.09.2016 23:10

Ну, и самый тупой вариант, диски не из HW Compatibility List. Но это маловероятно, т.к. "серверов за сотню", и таких проколов быть в принципе не может. Или может?

StepanRazin 14.09.2016 07:28

(30): Минимум в десятке других серверов установлено такое же сочетание RAID, дисков и ОС.

Почему на мать с самого начала и грешил - может RAID и мать создают фризы

Flukostat 14.09.2016 11:47

Таки я голосую за дисковую подсистему.
Счетчики вы озвучили. Кроме очереди на диск во время провалов. Присмотритесь.

StepanRazin 14.09.2016 12:21

(32): Уже не посмотреть.

Ощущение, что после установки kb2955164 проблема исчезла, хотя я не понимаю, почему оно не было установлено вместе с остальными при обновлении через Windows Update (при установке ОС в мае 2016 года были установлены все обновления, с многократными перезагрузками и проверками, что ничего больше не осталось).

А может быть просто "затаилась", если верно моё предположение про "высыхающую мать".

Тестируем дальше.

Попросил широковещательным запросом весь офис многократно в течение 5 минут получать-отправлять почту без перерыва. Никаких провисаний пока.

alexwww 14.09.2016 12:59

Опираясь на свой опыт, и скудную инфу от Романа, могу только на дисковую грешить. А там уже растаскивать подробности по кубикам.
"добавили памяти" куда? в контроллер или в супермикру?
Подразумевается, но не факт, что MB/RAID/HDD имеют перекрестный сертификат. FW дисков соответствуют FW контроллера, ну и пр. "мелочи"
Замените контроллер, для проверки. Должен же быть у солидного интегратора, один экземпляр на складе, на горячую замену для десятка серверов? Ну, не мне обьяснять тонкости отъема бабла)

StepanRazin 14.09.2016 13:05

(34): *оглядывается вокруг*: Где? Где солидный интегратор? krotov с DarkAngel не выступали в этой теме
%о)))

alexwww 14.09.2016 13:08

Кгхм,[quote]У меня сильно за сотню серверов на обслуживании[/quote]
Это про какого-то сопливого босяка, вероятно?

StepanRazin 14.09.2016 13:19

(36): Так и есть. И рэйдов таких парочку найду.

Но "солидный интегратор" - это точно не мы %о))
"Солидные интеграторы" обслуживают МТС-Мегафон и пр. компании такого уровня

alexwww 14.09.2016 13:29

"Солидный интегратор" измеряется не количеством/наличием Брендов/клиентов в обслуживании, а [u]качеством[/u] [filolog]ёпть[/filolog]..., т.е клиентов может быть и два, но железок на полке, для этих двоих, должно лежать в достатке. Это солидно. А "за сотню серверов" без железок, таки да, просто жадный, и недальновидный ухарь-купец)

StepanRazin 14.09.2016 13:57

(38): И вам спасибо за беседу и оценку моей деятельности.

За 13 лет я не потерял ни одного клиента (кроме случаев, когда клиент разорился).

Видимо достаточно качественно обеспечиваю бесперебойность работы, включая тех, кто работает по 24/7/365


Текущее время: 12:55. Часовой пояс GMT +3.