Как включить коррекцию ошибок оперативной памяти

Содержимое

  • 1 Что такое Ecc configuration в биосе: полный ответ на вопрос
    • 1.1 Что такое ECC configuration и зачем она нужна?
    • 1.2 Как проверить, поддерживает ли ваш компьютер ECC?
    • 1.3 Как включить ECC configuration в BIOS?
    • 1.4 Какие компоненты шины данных поддерживают ECC?
    • 1.5 Какие операционные системы поддерживают ECC?
    • 1.6 Как включить ECC в Windows?
    • 1.7 Как проверить, работает ли ECC на вашем компьютере?
    • 1.8 Какие существуют альтернативы ECC?
    • 1.9 Какое влияние на производительность оказывает ECC?
    • 1.10 Можно ли добавить ECC в уже работающий компьютер?
    • 1.11 Вопрос-ответ:
        • 1.11.0.1 Что такое ECC configuration в BIOS?
        • 1.11.0.2 Зачем нужна опция ECC configuration в BIOS?
        • 1.11.0.3 Как включить ECC configuration в BIOS?
        • 1.11.0.4 Как узнать, поддерживает ли моя система ECC memory?
        • 1.11.0.5 Можно ли включить ECC memory на системе, которая ее не поддерживает?
        • 1.11.0.6 Какие типы памяти поддерживают ECC?
        • 1.11.0.7 Какие преимущества дает ECC memory?
    • 1.12 Видео по теме:

ECC Configuration в BIOS – это особенная функция настроек, которая обеспечивает надежность работы оперативной памяти компьютера. В статье вы узнаете, как настроить ECC Configuration в BIOS и зачем это нужно для защиты данных от возможных ошибок при работе с памятью.

BIOS (Basic Input/Output System) является программой, устанавливаемой на материнскую плату компьютера, которая выполняет множество важных задач, включая контроль работы жестких дисков, оперативной памяти, а также настройки процессора. Одним из интересных функций BIOS является ECC configuration, которая позволяет повысить надежность памяти и уменьшить вероятность ошибок в ходе работы компьютера.

ECC (Error Correction Code) представляет собой метод проверки и исправления ошибок, которые могут возникать при записи и чтении информации из оперативной памяти. Эта технология лежит в основе ECC configuration в BIOS и позволяет автоматически исправлять ошибки в памяти, что делает работу компьютера более стабильной и безопасной.

Включение ECC configuration в BIOS-это простой процесс, который может быть выполнен даже пользователями с небольшим опытом использования BIOS. В данной статье мы рассмотрим, как включить ECC configuration в BIOS и поможем вам настроить эту функцию для оптимальной работы вашей системы.

Что такое ECC configuration и зачем она нужна?

Что такое ECC configuration и зачем она нужна?

ECC configuration — это функция, которая используется для обнаружения и исправления ошибок в памяти компьютера. Это особенно важно для тех, кто занимается вычислительными задачами или работает с большим объемом данных.

Если ошибка появляется в памяти компьютера, то система ECC может заметить ее и исправить до того, как она приведет к серьезным последствиям. Это может быть критически важным в случаях, когда малейшая ошибка может привести к полной потере данных или неверному результату вычислений.

Обычно, ECC configuration включается в BIOS и может быть настроена в соответствии с потребностями пользователя. Она может быть активирована для всех ячеек памяти или только для тех, которые используются для задач, требующих высокой точности.

В целом, ECC configuration является важной функцией, которая позволяет гарантировать стабильность работы компьютера и сохранение данных в безопасности. Если вы занимаетесь вычислительными задачами или работаете с большим объемом данных, то рекомендуется включить эту функцию в BIOS и настроить ее в соответствии с потребностями вашей работы.

Как проверить, поддерживает ли ваш компьютер ECC?

Как проверить, поддерживает ли ваш компьютер ECC?

Если вы хотите использовать память ECC в вашем компьютере, то первым шагом должно быть определение, поддерживает ли ваша система ECC. Для этого есть несколько способов:

  • Проверьте спецификации вашего компьютера. Если вы не знаете, поддерживает ли ваше устройство ECC, то стоит заглянуть в документацию. В ней обычно указано, поддерживает ли система ECC-память.
  • Проверьте BIOS вашего компьютера. Зайдите в настройки BIOS и найдите раздел, посвященный памяти. Обычно он называется Memory Configuration или Memory Settings. Если в этом разделе есть настройка, связанная с ECC, значит, ваша система ее поддерживает.
  • Используйте специальные программы. Существуют некоторые программы, которые могут проверить, поддерживает ли ваше устройство ECC. Например, AIDA64 или CPU-Z. Запустите программу и найдите раздел, содержащий информацию о поддержке ECC.

Обратите внимание, что поддержка ECC зависит от типа процессора и материнской платы. Некоторые процессоры, такие как Intel Xeon, часто используются в серверах и поставляются с поддержкой ECC. Если вы используете процессоры Intel Core i5 или i7, то вероятнее всего, поддержка ECC вам не доступна.

Как включить ECC configuration в BIOS?

Как включить ECC configuration в BIOS?

Конфигурация ECC (Error Correction Code) – это функция, которая позволяет обнаруживать и исправлять ошибки в памяти компьютера. Она может быть очень полезна для пользователей, которые занимаются вычислениями, которые требуют высокой точности и надежности.

Чтобы включить ECC configuration в BIOS, следуйте простым инструкциям:

  1. Запустите компьютер и нажмите клавишу Del или F2, чтобы войти в BIOS. В зависимости от производителя вашего компьютера, возможно, требуется нажать другую клавишу.
  2. Используя стрелочные клавиши, найдите пункт «Memory Settings» (Настройки памяти) или «Memory Advanced Settings» (Продвинутые настройки памяти).
  3. Найдите опцию «ECC Mode» (Режим ECC) и выберите значение «Enabled» (Включенный).
  4. Сохраните изменения и выйдите из BIOS. Для этого выберите пункт «Save Changes and Exit» (Сохранить изменения и выйти).

После того, как вы включили ECC configuration в BIOS, рекомендуется проверить, что все работает правильно, используя специализированные программы проверки памяти.

Включение функции ECC configuration в BIOS — это очень важный шаг для тех, кто заботится о точности и надежности своих вычислений. Не забывайте, что функция ECC configuration доступна не для всех типов памяти, поэтому если у вас возникли сложности в ее настройке, обратитесь за помощью к профессионалам.

Какие компоненты шины данных поддерживают ECC?

ECC (Error Correction Code) – это технология, которая используется для исправления ошибок памяти. Эта технология нашла применение в различных компонентах компьютера.

В основном, ECC поддерживается следующими компонентами:

  • Процессоры: некоторые процессоры Intel и AMD поддерживают ECC, но функциональность может быть ограничена и зависит от модели процессора.
  • Материнские платы: многие материнские платы имеют поддержку ECC, но эта функция может быть скрыта в BIOS и требовать дополнительной настройки.
  • Оперативная память: ECC поддерживается на определенных типах оперативной памяти, таких как DDR3 ECC и DDR4 ECC. Но для использования ECC необходимо, чтобы и процессор, и материнская плата также поддерживали эту функцию.

Важно понимать, что использование ECC памяти может уменьшить производительность системы из-за дополнительной нагрузки на процессор. Однако, в случае использования приложений, которые требуют максимальной стабильности и устойчивости, использование ECC памяти может быть весьма полезным.

Какие операционные системы поддерживают ECC?

ECC (Error Correction Code) – это технология, используемая для исправления ошибок в памяти. Она позволяет обнаруживать и исправлять ошибки, которые могут возникнуть в процессе чтения и записи информации в оперативную память. Это особенно важно для серверов и научных вычислений, где каждый бит информации может быть критичен.

Поддержка ECC зависит от процессора и от операционной системы. К счастью, большинство современных ОС поддерживают ECC. Это включает в себя:

  • Windows: поддерживается только в версии Windows 10 Pro для рабочих станций и Windows Server.
  • macOS: поддерживается на компьютерах Apple, включая iMac Pro, Mac Pro и MacBook Pro с процессорами Intel Xeon и AMD Ryzen.
  • Linux: поддерживается во многих дистрибутивах Linux, включая CentOS, Debian, Fedora, RedHat и Ubuntu.

Если ваша ОС поддерживает ECC, вы можете включить эту функцию в BIOS вашего компьютера. Это позволит обеспечить надежность и стабильность работы вашей системы в условиях интенсивной нагрузки.

Как включить ECC в Windows?

ECC (Error Correction Code) — функция, позволяющая выявлять и исправлять ошибки в регистрах памяти системы. Если у вас есть компьютер с ECC RAM, которая поддерживает работу с ECC в операционной системе, у вас есть возможность использовать эту функцию в Windows.

Для включения ECC в Windows необходимо:

1. Убедиться в том, что используется ECC RAM, которая поддерживает работу с ECC в операционной системе.

2. В BIOS настроить поддержку ECC и включить ее.

3. Установить на компьютер операционную систему, которая поддерживает работу с ECC.

4. Обновить драйверы устройств до последней версии.

5. Выполнить настройку ECC в Windows.

Для настройки ECC в Windows необходимо выполнить следующие действия:

1. Запустить панель управления Windows.

2. Выбрать «Администрирование».

3. Выбрать «Службы».

4. Найти службу «Memory Error Correction».

5. Установить режим «Автоматический запуск» для этой службы.

6. Перезапустить компьютер.

После выполнения всех этих действий функция ECC будет включена на вашем компьютере в операционной системе Windows.

Как проверить, работает ли ECC на вашем компьютере?

Прежде всего, необходимо убедиться, что ваш компьютер поддерживает ECC. Для этого можно заглянуть в документацию или на сайт производителя.

Если компьютер поддерживает ECC, то можно проверить, работает ли он на нем, используя специальное программное обеспечение. Одним из таких инструментов является MemTest86, который позволяет проводить диагностику памяти компьютера.

При запуске MemTest86 необходимо выбрать тестирование ECC и запустить процесс. Если на вашем компьютере работает ECC, то в отчете тестирования должно быть указано, что проверка ECC прошла успешно.

Также можно проверить наличие ECC на компьютере, перейдя в BIOS и проверив настройки памяти. Если ECC включен, то в настройках должно быть указано, что память работает в режиме ECC.

В любом случае, если вы не уверены, что ECC работает на вашем компьютере, рекомендуется связаться с производителем или специалистом в области информационных технологий, чтобы получить консультацию и помощь в настройке.

Какие существуют альтернативы ECC?

ECC память — это специальный вид оперативной памяти, который использует дополнительный бит проверки ошибок для обеспечения надежности данных. Однако, не все системы поддерживают ECC память и не всегда это является лучшим решением для всех ситуаций. Рассмотрим некоторые альтернативы ECC памяти.

Non-ECC память: это тип оперативной памяти, который не использует дополнительный бит проверки ошибок. Non-ECC память обычно более доступна по цене, но менее надежна, чем ECC память.

Registered (buffered) память: это тип оперативной памяти, который содержит буферный регистр на модуле памяти. Registered память может улучшить стабильность системы и позволяет использовать больше памяти, но требует больше энергии и может быть менее производительной, чем ECC или Non-ECC память.

RAID массивы: аппаратные или программные RAID массивы могут использоваться для обеспечения отказоустойчивости данных, дублируя данные на нескольких устройствах хранения. RAID 1 (зеркалирование) и RAID 10 (RAID 1+0) являются наиболее распространенными уровнями RAID, которые обеспечивают отказоустойчивость и высокую производительность.

Бэкап и восстановление данных: установка резервного копирования и регулярное выполнение процедуры восстановления данных может быть использовано в качестве альтернативы улучшения надежности данных. Резервное копирование может быть выполнено на локальном устройстве хранения или облачных сервисах хранения.

Каждый тип альтернативы имеет свои преимущества и недостатки, поэтому при выборе следует учитывать конкретные требования и возможности системы. ECC память является частным случаем меры по обеспечению целостности данных, которая может быть улучшена с помощью различных других решений.

Какое влияние на производительность оказывает ECC?

Какое влияние на производительность оказывает ECC?

Ошибка чтения или записи данных в оперативной памяти может привести к непредсказуемым последствиям и серьезным проблемам для производительности компьютера. Введение технологии ECC (Error Correcting Code) позволяет обеспечить более надежную работу памяти и снизить вероятность возникновения ошибок.

К сожалению, использование ECC не влияет на производительность памяти, но защита от ошибок является более критическим фактором при работе с критическими системами, требующими надежной и стабильной работой.

Это означает, что для обычного пользователя компьютера, использование ECC не сильно повлияет на производительность, но оставляет больше маржи для непрерывной работы системы. В то же время, для групповых рабочих станций и серверов, где критически важна надежная работа памяти, использование ECC может быть очень полезным.

Можно ли добавить ECC в уже работающий компьютер?

Можно ли добавить ECC в уже работающий компьютер?

Добавление ECC в уже работающий компьютер возможно, но только при наличии поддержки данной технологии со стороны материнской платы и процессора. Кроме того, необходимо установить специальные модули оперативной памяти, поддерживающие ECC.

Перед установкой модулей ECC следует обязательно проверить совместимость новой памяти с уже установленной, поскольку некоторые материнские платы не поддерживают смешанное использование ECC- и non-ECC-модулей, а также различие между ECC и non-ECC может привести к нестабильной работе системы.

В случае успешной установки ECC компьютер будет обладать большей надежностью в работе, что особенно важно для серверов и рабочих станций, где происходит обработка критически важной информации. Однако, для домашнего использования, эта технология может быть не так актуальна.

Вопрос-ответ:

Что такое ECC configuration в BIOS?

ECC configuration в BIOS – это опция, позволяющая включить режим коррекции ошибок памяти (ECC) на вашем компьютере.

Зачем нужна опция ECC configuration в BIOS?

Коррекция ошибок памяти (ECC) позволяет обнаруживать и исправлять ошибки в памяти вашего компьютера. Это важно для систем, где ошибка может привести к серьезным последствиям, например, в серверах и рабочих станциях, где данные играют ключевую роль.

Как включить ECC configuration в BIOS?

Чтобы включить ECC configuration в BIOS, зайдите в настройки BIOS, найдите раздел Memory Settings и в нем опцию ECC Configuration. Установите ее значение на Enabled.

Как узнать, поддерживает ли моя система ECC memory?

Чтобы узнать, поддерживает ли ваша система ECC memory, можно обратиться к документации на материнскую плату либо к спецификации процессора. Также можно воспользоваться утилитой CPU-Z, которая покажет, поддерживает ли процессор ECC memory.

Можно ли включить ECC memory на системе, которая ее не поддерживает?

Нет, нельзя. Чтобы использовать ECC memory, ваша система должна поддерживать эту технологию. Если ваша система не поддерживает ECC memory, установка этого типа памяти будет бесполезна.

Какие типы памяти поддерживают ECC?

Некоторые типы памяти поддерживают ECC, в том числе DDR2, DDR3 и DDR4. Однако, не все модули памяти поддерживают ECC, и для использования этой технологии необходима соответствующая материнская плата и процессор.

Какие преимущества дает ECC memory?

ECC memory дает преимущества в тех системах, где надежность и целостность данных критически важны. Это могут быть серверы, рабочие станции, системы хранения данных, банковские системы и т.д. Благодаря использованию ECC памяти можно избежать сбоев и ошибок в работе этих систем, что повышает их стабильность.

Видео по теме:

Опция Data Integrity (PAR/ECC) позволяет включить использование режимов обнаружения ошибок (контроля четности и коррекции ошибок) в оперативной памяти.

Значения опции:

Enabled – использовать функцию обнаружения ошибок в оперативной памяти;

Disabled – отключить функцию.

Опция также может иметь другие названия:

Memory Parity/ECC Check

Примечание 1. Оперативная память (Random Access Memory, RAM, системная память) – это энергозависимая компьютерная память, которая предназначена для временного хранения активных программ и данных, используемых процессором во время выполнения операций.

Более подробно о том, что такое оперативная память, Вы можете узнать здесь.

Примечание 2. ЕСС (Error Checking and Correction Memory, коррекция ошибок) – это алгоритм, позволяющий исправлять 1-битные ошибки и определять 2-битные при работе оперативной памяти и кэш-памяти.

Примечание 3. Parity (контроль четности) – это алгоритм, предназначенный для проверки целостности передаваемых данных по любой шине. При данном способе проверки для каждых восьми бит (1 байт) в процессе записи вычисляется контрольная сумма (контрольная сумма (бит чётности) — некоторое значение, рассчитанное путём применения определенных операций над входными данными и служащее для проверки общей чётности двоичного числа). При чтении данных контрольная сумма вычисляется снова и сравнивается с контрольной суммой, которая была создана в процессе записи. Если они совпали, то данные считаются верными. Изменение состояния бита чётности говорит о возникшей ошибке.

Еще по настройке БИОС (БИОЗ) плат:

  • Опция BIOS DRAM Clock — Memory Frequency — частота шины оперативной памяти
    Опция DRAM Cl…

  • Опция Write to Read Delay определяет количество тактов между окон…

  • Опция Write Recovery Time определяет количество тактов между окон…

  • Использование опции Write Latency позволяет использовать дополнит…

  • Опция User Config mode отвечает за способ установки дополнительны…

Добавить комментарий

Модули оперативной памяти. Технология исправления ошибок Chipkill.

На работу модулей оперативной памяти оказывают влияние множество негативных факторов, которые могут вызвать появление ошибок в считанной информации. Ошибки памяти можно подразделить на аппаратные и случайные. Аппаратные ошибки обычно обусловлены неустранимыми дефектами кремниевого кристалла или монтажных соединений микросхем DRAM. Случайные ошибки (сбои) обычно вызываются заряженными частицами или излучением. Такие ошибки непостоянны и действуют кратковременно. Ранее основной причиной случайных ошибок были альфа-частицы, но более строгий контроль качества материала, из которого делаются корпуса микросхем DRAM, позволил производителям практически ликвидировать эту причину сбоев. В настоящее время основной источник случайных ошибок в микросхемах DRAM — электрические возмущения, вызванные космическими лучами — потоками высокоэнергетических элементарных частиц, приходящими из космоса. Для повышения надежности функционирования компьютерной техники, применяется метод контроля четности памяти, но этот метод позволяет лишь обнаруживать ошибки, а не исправлять их.

Но для наиболее ответственных приложений, где цена ошибки очень высока, используют модули памяти с коррекцией ошибок ECC (Error Checking and Correcting — обнаружение и исправление ошибок).

Идея, лежащая в основе метода ECC, довольно проста — каждый разряд памяти входит более чем в одну контрольную сумму. Это увеличивает число контрольных разрядов, но дает возможность восстанавливать значение сбойного бита по несовпадающим контрольным суммам. Основной недостаток при использования ECC — снижение общей производительности системы, на которую возлагаются дополнительные вычисления.

Другой способ реализации ECC — размещение логики контроля не в контроллере памяти на системной плате, а на самом модуле. Это позволяет избежать снижения производительности, но стоимость таких модулей выше, чем обычных. Поскольку ошибки в большем числе разрядов случались чрезвычайно редко, метод ECC позволил существенно повысить надежность систем. Сегодня технология ECC стала стандартом и применяется практически во всех серверах.

Еще одним механизмом исправления ошибок, который был предложен как одна из составных частей инициативы X-Architecture корпорации IBM, стала технология исправления ошибок Chipkill. Эта технология обеспечивает защиту серверов от отказов отдельных микросхем и многоразрядных ошибок в модулях памяти. Технология Chipkill, перенесенная IBM с больших систем, существенно сокращает среднее время простоя серверов и обеспечивает более надежную платформу для клиент-серверных вычислений на базе микропроцессоров Intel. Она призвана повысить надежность систем, доступность и удобство в эксплуатации, что является ключевыми характеристиками серверов масштаба предприятия, обслуживающих критически важные приложения.

Архитектура Chipkill позволяет системе безболезненно воспринимать ошибки, которые в обычных условиях приводят к неустранимым сбоям, тем самым обеспечивая сохранность данных и высокую доступность системы. В системах высокой доступности, таких как серверы масштаба предприятия IBM S/390, проблема многоразрядных ошибок памяти DRAM отсутствует благодаря особой архитектуре оперативной памяти. Подсистема памяти сконструирована так, что отказ отдельной микросхемы, независимо от ее разрядности, не затронет более одного разряда в каком-либо из нескольких слов ECC. Например, в 4-разрядной микросхеме DRAM отдельные биты из всей четверки попадают в разные слова ECC, т. е. в разные адресные пространства памяти. Поэтому даже в случае полного отказа микросхемы количество ошибочных разрядов в словах ECC не превысит единицу, а такую ошибку механизм ECC устраняет автоматически. Данная архитектура обеспечивает отказоустойчивость всей подсистемы памяти.

Тщательно продуманная конструкция мэйнфреймов защищает их и от сбоев микросхем памяти. В каждом модуле памяти разрядность микросхем равна числу разрядов, защищенных механизмом ECC. Нынешние серверы на базе микропроцессоров Intel такого механизма не поддерживают так как рынок требует дешевой памяти, вынуждая проектировщиков создавать очень плотные микросхемы памяти, поддерживающие отраслевой стандарт (исключительно ECC).

Предлагаемая технология Chipkill является механизмом, позволяющим памяти противостоять многоразрядным ошибкам на отдельных микросхемах DRAM, в том числе и сбою всех разрядов данных. В механизме Chipkill есть два основных метода исправления ошибок, причем они могут применяться совместно. Эти методы базируются на определенном наборе микросхем и особой аппаратной архитектуре системы, поэтому их поддержку невозможно обеспечить простым обновлением ПО.

В первом методе каждый бит данных модуля памяти размещается в отдельном «слове ECC», которое представляет собой набор разрядов данных и контрольных разрядов, в котором обнаружение и исправление ошибок обеспечивается алгоритмом ECC.) Предположим, что разрядность системы памяти составляет 32 байт (или 256 разрядов). Биты ECC добавляются так, чтобы общая ширина блока (и контрольные, и биты данных) составляла 288 разрядов. Четыре слова ECC, каждое из которых состоит из 64 разрядов данных и 8 контрольных разрядов ECC, поддерживают механизм SEC/DED. Эти четыре слова ECC распределяются по DRAM-модулям. Например, если DIMM содержит модули х4 DRAM, четыре бита каждого устройства распределяются по разным словам ECC (рис. 1). Сбой всех четырех битов — это всего лишь четыре единичные ошибки в четырех словах ECC, и они устраняются автоматически. В этом примере механизм Chipkill поддерживается только на DIMM-модулях, состоящих из микросхем х4 DRAM.

 

Рис. 1. Пример технологии Chipkill.

Второй метод заключается в предоставлении механизму ECC большего числа разрядов для хранения контрольных кодов, чтобы обеспечить исправление не одного, а нескольких разрядов. При этом используются соответствующие математические алгоритмы устранения многоразрядных ошибок при определенном количестве контрольных битов ECC и битов данных. Например, 144-разрядное слово ECC, состоящее из 128 разрядов данных и 16 битов ECC, позволяет исправлять ошибки, охватывающие до 4 разрядов данных. Для исправления сбоя четырех бит необходимо, чтобы они были смежными, а не располагались случайно. Соотношение разрядов ECC и разрядов данных такое же, как и в предыдущем примере (16/128 и 8/64), однако более длинное слово ECC позволяет применить более эффективный алгоритм обнаружения и исправления ошибок.

Совместное использование этих двух методов обеспечивает коррекцию по механизму Chipkill на DIMM-модулях с микросхемами х8 DRAM. Два 144-разрядных слова ECC распределяются так, чтобы на каждом DRAM в первом и втором словах ECC исправлялись по 4 разряда. Этот метод обеспечивает поддержку механизма Chipkill при использовании DIMM-модулей, состоящих как из микросхем х4 DRAM, так и из х8 DRAM. Инженеры IBM решили эту проблему, разместив избыточный массив недорогих микросхем DRAM (Redundant Array of Inexpensive DRAM, RAID) непосредственно на DIMM-модулях. При каждом доступе к памяти RAID-микросхема вычисляет контрольный код ECC для всего набора микросхем и сохраняет результат в резервной памяти на защищаемом DIMM-модуле. В случае отказа одной микросхемы DIMM-модуля сохраненная на RAID-массиве информация применяется для восстановления потерянных данных, обеспечивая бесперебойную работу всего сервера Netfinity. Такая RAID-технология напоминает RAID-механизмы, применяемые для защиты данных в дисковых массивах, и называется Chipkill DRAM.

Специалисты компании IBM разработали заказную специализированную микросхему для Chipkill, которая называется ECC ASIC (Application-Specific Integrated Circuit) и выполняет исправление ошибок без замедления доступа к высокопроизводительной EDO-памяти со временем доступа 50 нс. Таким образом, при установке DIMM-модулей IBM Chipkill на серверы Netfinity, оборудованные процессором Intel Xeon, модификация плат памяти не нужна, а новые модули не вызывают снижения производительности.

Технология IBM Chipkill Memory позволила снизить число отказов серверов Netfinity по причине сбоев подсистемы памяти до невероятно низкого уровня. Основной задачей механизма Chipkill является исправление ошибок памяти, в нем применяются такие же способы обнаружения и оповещения, что и в ECC. Обнаружение и оповещение Chipkill никак не сказывается на производительности оборудования или ПО (потери те же, что и для стандартных механизмов ECC). Обнаружение постоянных и случайных ошибок, исправление ошибок памяти и оповещение о них в серверных архитектурах с применением обоих механизмов — ECC и Chipkill выполняется в системном наборе микросхем. Для обнаружения, код исправления ошибок (ECC) генерируется при записи и проверяется при чтении во всех системных операциях с памятью «прозрачно» для прикладных программ. Обнаруженная ошибка автоматически исправляется до передачи данных получателю. При этом событие ошибки регистрируется оборудованием, а системная BIOS уведомляется об исправлении ошибки и о месте, где она произошла. Набор микросхем также ведет учет исправленных ошибок, что позволяет BIOS выявлять DIMM-модули, в которых ошибки возникают и исправляются постоянно. Получив уведомление, система BIOS опрашивает регистры набора микросхем, чтобы определить, где произошла ошибка памяти (порядок такого опроса сильно зависит от конструкции конкретной системы, поэтому он и выполняется на уровне BIOS). Обнаружив модуль DIMM, вызвавший ошибку, BIOS регистрирует эту информацию в системном журнале, который является, например, частью встроенной системы управления сервером (Embedded Server Management).

Дефектные DIMM-модули легко заменить в процессе эксплуатации, для них требуется лишь предсказательное оповещение об ошибках и замене, поэтому нет необходимости локализовать ошибки с точностью до отдельной микросхемы на плате DIMM-модуля. Получая за сравнительно короткое время повторяющиеся сообщения об исправленных ошибках от одного и того же DIMM-модуля, BIOS отключает соответствующий механизм оповещения и регистрирует этот факт в журнале системы управления сервером. Это избавляет систему от дополнительной нагрузки, обусловленной обработкой всех ошибок памяти.

Программное обеспечение управления системой, поставляемое в составе многих серверов, анализирует системный журнал при каждом внесении записи системой BIOS. Ошибки единичных разрядов инициируют уведомления одного из трех возможных уровней: warning («предупреждение»), critical («критическая»), nonrecoverable («неустранимая»). По-настоящему случайная ошибка вряд ли инициирует уведомление в стеке программы управления системой. Однако в случае постоянных неполадок в работе DIMM-модуля инициируется уведомление программе управления системой, после чего та назначает службе технической поддержки задание на замену неисправного DIMM-модуля. А постоянная ошибка, вызвавшая отключение механизма регистрации исправлений, в любом случае инициирует уведомление. Конечно постоянные ошибки в одном разряде или ошибки, устраняемые средствами Chipkill, не вызывают отказа системы, но тем не менее они увеличивают вероятность того, что очередная случайная ошибка приведет к критическому, неустранимому сбою, поэтому администраторы системы внимательно следят за уведомлениями о дефектных DIMM-модулях и своевременно выдают ремонтной службе задания на их замену.

Технология Chipkill поддерживается и в новом универсальном наборе микросхем IBM Summit, который хорошо подходит как для 64-разрядных микропроцессоров семейства Itanium, так и для 32-64 разрядных процессоров Xeon. Чипсет сможет поддерживать до четырех процессоров, позволяя им разделять такие ресурсы, как шины ввода-вывода и шины памяти. Четыре набора могут связываться воедино, что даст серверам на базе Summit возможность поддерживать до 16 полностью автономных микропроцессоров (например, в четырехпроцессорном сервере можно будет выделить три кристалла под Windows, а один — под Linux, а если все процессоры работают в одной среде, можно будет проводить их «горячую» замену).

По мнению ряда экспертов, присущая мэйнфреймам надежность и отказоустойчивость скоро потребуется и в небольших серверах, оборудованных микропроцессорами Intel.  

Совет 1: Как поправить ошибки оперативной памяти

При настройке параметров работы оперативной памяти нужно рассматривать уйма нюансов. Если во время работы ОЗУ выявляются ошибки, их дозволено поправить программным способом.

Как поправить ошибки оперативной памяти

Инструкция

1. Проверьте состояние оперативной памяти и ее продуктивность. Откройте панель управления и выберите меню «Система и безопасность». Кликните по ярлыку «Средство проверки памяти Windows», расположенному в меню «Администрирование». Выберите пункт «Перезагрузить и проверить». Дождитесь заключения теста оперативной памяти. Если программа выявила ошибки, то вначале сбросьте параметры работы планок памяти.

2. Откройте меню BIOS, перезагрузив компьютер. Выберите пункт Use Default Settings и нажмите клавишу Enter. Удостоверите использование заводских настроек. Перезагрузите компьютер и опять исполните проверку состояния оперативной памяти. Если программа опять выявили ошибки, повторите процедуру входа в меню BIOS.

3. Обнаружьте и откройте меню, отвечающее за параметры работы ОЗУ. Обыкновенно для доступа к данному меню нужно нажать сочетание клавиш Ctrl и F1. Вначале немножко уменьшите частоту работы планок оперативной памяти. Это дозволит снизить нагрузку на данные устройства. Ложно полагать, что эта операция приведет к замедлению работы компьютера. Присутствие ошибок в работе планок ОЗУ дает значительно больше сильное замедление системы. Сбережете параметры меню BIOS и перезагрузите ПК. Опять проведите тест ОЗУ.

4. Вернитесь к меню настроек параметров работы оперативной памяти. Обнаружьте четыре пункта, отображающие показатели таймингов ОЗУ. Увеличьте все четыре показателя на один пункт. Это приведет к тому, что платы памяти будут трудиться немножко неторопливей. Если позже этого перестанут появляться ошибки, вы не подметите падения эффективности компьютера.

5. Сбережете настройки и исполните тестирование планок оперативной памяти. Отключите все планки ОЗУ и проверьте всякую в отдельности. Замените неисправную планку, если вам не удалось поправить возникшие неполадки.

Совет 2: Как проверить оперативную память на ошибки

Синий «экран гибели» в операционной системе Windows, а также скептические ошибки BSOD нередко появляются из-за неполадок с ОЗУ компьютера – его оперативной памятью . Что указывает на неисправность планки RAM и как протестировать оперативную память на присутствие ошибок?

Как проверить оперативную память на ошибки

Вам понадобится

  • – программа Memtest.

Инструкция

1. Для начала стоит разобраться, а есть ли сбои в ОЗУ. Поврежденная оперативная память генерирует ошибки с ключевым словом “memory”. Если ваш компьютер зависает либо перезагружается на синем экране – храбро проверяйте ОЗУ.

2. Проверка оперативной памяти на ошибки осуществляется специализированными автозагружающимися программами, то есть этим программам не надобен запуск Windows, следственно вы можете не беспокоиться – следующий сбой ОЗУ во время проверки не произойдет и программа проработает до финального заключения.

3. Для тестирования оперативной памяти стандартно используется программа Memtest (Memtest 86, Memtest 86+). Традиционно такого средства довольно, дабы узнать планку с оплошностью и какая именно оплошность либо неисправность в ней содержится.

4. Программу Memtest дозволено загрузить с официального сайта – www.memtest86.com. Программа запакована в ISO-образ, тот, что нужно установить на чистый CD, позже чего, перезагрузив компьютер, в BIOS необходимо установить первым загрузочным компонентом дисковод. Позже этого программа загрузится, и вы сумеете приступить к диагностике ОЗУ. По окончанию диагностики (а ее время зависит от объема оперативной памяти) программа выдаст отчет на экран компьютера.

5. Также в последних операционных системах Microsoft, таких как Windows Vista и Windows 7, существует встроенное и достаточно сильное средство проверки оперативной памяти на присутствие ошибок. Оно именуется Windows Memory Diagnostic. При запуске компьютера нажмите клавишу “F8”, и вы увидите так называемое меню «Дополнительных вариантов загрузки». Выберите «Устранение неполадок Windows», а на новом экране – в разделе «Средства» клавишей “Enter” выберите «Диагностика памяти».

Совет 3: Как отключить тест памяти

В ходе проверки оборудования перед загрузкой компьютера BIOS три раза исполняет тестирование ОЗУ. Данный процесс является довольно долгим, и если сама ОС загружается стремительно, такую проверку желанно отключить.

Как отключить тест памяти

Инструкция

1. Войдите в программу CMOS Setup. Для этого включите либо перезагрузите компьютер. Осуществляйте перезагрузку не кнопкой Reset, а штатными средствами запущенной ОС. Перед этим не позабудьте сберечь все документы и закончить работу приложений. Сразу позже заключения работы ОС либо подачи на машину питание начните нажимать клавишу Delete либо F2, в зависимости от изготовителя и версии BIOS.

2. Если утилита CMOS Setup запросит у вас пароль, введите его. В случае, если вы позабыли пароль, а компьютер является вашим личным, обесточьте его, снимите батарейку с материнской платы, замкните контакты разъема для нее (но ни в коем случае не саму батарейку), а после этого установите ее обратно, соблюдая полярность. Дозволено также воспользоваться особым джампером для чистки CMOS, при наличии такового. После этого подайте на компьютер питание, вновь войдите в CMOS Setup и установите при необходимости новейший пароль.

3. Мышь в утилите настройки BIOS обыкновенно не работает. Клавишами со стрелками подведите указатель к пункту под наименованием Advanced BIOS Setup либо аналогичным. Выберите в этом разделе пункт Extended Memory Test (его наименование также может отличаться от указанного). Клавишами Page Up и Page Down присвойте ему значение Disabled. В некоторых версиях Bios для этого могут применяться другие клавиши, а взамен слов Disabled и Endbled – слова No и Yes.

4. Нажмите клавишу F10. После этого нажмите клавишу Y либо Enter, в зависимости от того, какое на экран будет выведено сообщение. Компьютер начнет загружаться. Проследите, дабы при этом не происходило тестирования ОЗУ. Учтите, что тест, встроенный в BIOS, горазд выявить не все недостатки оперативной памяти . Для больше тщательной проверки используйте программу Memtest86+. Она работает значительно дольше: полный цикл тестирования занимает около часа, а при большом объему ОЗУ либо малой скорости процессора – до 3 часов.

Видео по теме

Всем привет! Тема сегодняшней публикации — поддержка ECC оперативной памяти: что это такое, как работает данная функция, зависит ли от процессора ее использование на ПК.

Что такое ЕСС память

Аббревиатура происходит от английского названия error correcting code memory, то есть память с коррекцией ошибок кода. Такая ОЗУ распознает и устраняет спонтанно возникающие изменения в битах памяти, которых быть не должно.

Как правило, такая память может исправить изменения в одном бите одного машинного слова. При его чтении будет опознано то же значение, что и было записано, несмотря на возникающие «глюки».

Обычная память, то есть non-ECC, этого делать не умеет.

Этот тип памяти используется в компьютерах, для которых важна бесперебойная работа, включая крупные серверные станции. Для использования такого режима необходима поддержка контроллером ОЗУ – как встраиваемого в чипсет, так и реализованном на кристалле вместе с ядрами.

Базовый алгоритм, который используется чаще всего, основан на коде Хемминга – самоконтролирующемся  двоичном коде, названном в честь предложившего такую систему американского математика.

Существуют алгоритмы, способные исправлять более одной ошибки, но используются они реже. С технологической точки зрения такая система предполагает использование модулей ОЗУ, в которых на каждые 8 микросхем памяти приходится один компонент, хранящий ЕСС-коды (то есть 8 бит на каждые 64 бита).

Причины появления ошибок в ОЗУ

Главная проблема для любого электронного устройства – невидимые космические лучи, от которых земная атмосфера не защищает должным образом. Элементарные частицы, которые пребывают в этом потоке, способны влиять на работу электроники.серверная ОЗУПод их воздействием физические свойства оперативки могут меняться, что уже ведет к размагничиванию. При смене данных, из единицы (заряженное состояние) на ноль (разряженное) уже появляется искажение.

А так как любой компьютер на самом «глубинном» уровне проводит все вычисления с помощью двоичных кодов, нарушения свойств электронных компонентов и провоцируют ошибки в работе.

Характерно, что чем выше от уровня моря, тем меньше плотность воздуха и соответственно, интенсивнее космическое излучение. Компьютерные системы, которые работают на большой высоте, требуют более эффективной защиты. Советую также почитать «Что такое ОЗУ в компьютере: из чего состоит и для чего служит?»(уже на сайте).

Стоит ли использовать ЕСС память

Объективных причин для использования такой ОЗУ на домашнем ПК нет.

Несмотря на то, что земной диск медленно дрейфует по Космическому океану, покоясь на спинах трех китов, вероятность искажения данных под воздействием вредоносных лучей, на самом-то деле крайне мала. При этом самое страшное, что может случиться при таких неполадках – вылет операционной системы в синий экран.

Впрочем, это может быть действительно страшно – например, в случае, если вы в течение пары часов монтировали видеоролик, забывая сохраняться в процессе, или же у вас последний и решительный бой, от которого зависит судьба клана, в какой-нибудь ММОРПГ.

Такая память работает медленнее обычной – в среднем, на 2-3%, так как для проверки контрольных сумм необходим один дополнительный такт контроллера. Такой режим работы требует больше логических ресурсов.

Как уже сказано выше, в основном такая память почти всегда регистровая (Registered), то есть имеет дополнительный регистр для считывания и хранения двоичных кодов. Существуют модули ECC памяти без регистров (UDIMM), которые можно использовать в домашних ПК.

Однако учтите, что такое удовольствие обойдется дороже, так как цена на такие модули ОЗУ обычно выше. Кроме того, требуется наличие материнской платы, чипсета и процессора (к слову, такие модели есть и у Intel, и у AMD), поддерживающих ЕСС память. Стоят они внезапно тоже, как правило, дороже.

И если вы решили проапгрейдить комп для использования ЕСС памяти, проверьте спецификации упомянутых выше компонентов. Если в описании написано что нет поддержки такого режима, деталь придется менять на более подходящую, что значит дополнительные расходы.

Не исключено, что придется менять и мать, и «камень», и планки оперативки. При сборке нового компьютера несколько проще: можно сразу купить соответствующие компоненты. Однако, на мой взгляд, это уже лишнее – страховка от мнимых сбоев не стоит потери быстродействия.

Также советую на эту тему ознакомиться с публикациями «Влияние тактовой частоты оперативной памяти в компьютере»(уже на блоге) и «Тайминги и частота оперативной памяти: кто важнее и влиятельней?». Буду признателен всем, кто расшарит эту статью в социальных сетях. До завтра!

С уважением, автор блога Андрей Андреев.

Можно ли использовать модули оперативной памяти (ОЗУ) от обычного компьютера в сервере? И наоборот? Чем серверная оперативная память отличается от обычной?

Следует сразу сказать, что не какой-то особой «серверной» памяти. Есть различные виды оперативной памяти, некоторые из которых подходят для серверов, а некоторые – только для обычных персональных компьютеров.

Основное отличия оперативной памяти для серверов в том, что последняя должна поддерживать технологию ECC (Error Correction Code), кода коррекции ошибок. Эта память способна обнаруживать и исправлять возникающие ошибки данных в битах памяти. Для обычных пользовательских компьютеров распознавание и автоматическая коррекция ошибок некритичны, поскольку нагрузка серверов и обычных компьютеров несравнимы между собой по объёму потоков данных, поэтому битовые сбои в обычных компьютерах происходят гораздо реже, чем в серверах.

Есть и другие отличия серверной памяти, например, буферизованная и не буферизованная память, но эти различия больше относятся к различным видам серверной памяти как таковой.

ECC

Поддержка ЕСС (Error Correction Code) – главная особенность серверной памяти, которая значительно удорожает на 10-30% цену памяти для серверов. Бывают системные администраторы, которые, желая сэкономить деньги компании, ставят в сервер память для обычного десктопа, и сервер при этом иногда работает. Но обычно это случается, во-первых, лишь для серверов начального класса, а во-вторых, возможность сбоев работы сервера значительно возрастает.

ECC даёт возможность исправлять ошибок одиночных битов в оперативной памяти. Если для обычных десктопов такие ошибки не очно критичны, то для серверов, с высокой интенсивностью вычислений, такие ошибки могут приводить к серьёзным сбоям бизнес-процессов и к убыткам предприятий.

ECC-память содержит специальные контрольные биты и дополнительные контроллеры памяти, которые управляют этими битами в специальной микросхеме модуля памяти. В них хранится код ЕСС, вносимый при записи данных. Во время считывания данных код ECC, созданный при записи корректных данных, сопоставляется с кодом ECC, созданным при чтении данных. Если код, созданный при чтении, не соответствует коду при записи, то при его дешифровке можно определить, какой бит подвергся искажению, после чего этот бит немедленно исправляется.

Рис. 1. Принцип работы ЕСС.

Рис. 1. Принцип работы ЕСС.

ECC, используется в компьютерах с повышенными требованиями устойчивости к повреждению битов данных, например, для научных или финансовых вычислений, а также в корпоративных серверах.

Некоторые системные платы и процессоры для менее критичных приложений могут не поддерживать использование памяти ЕСС, и их цена может быть ниже. Некоторые системы могут поддерживать не буферизованные модули памяти ECC, но при этом могут также работать и с не-ЕСС памятью. В этом случае, функционал ECC обеспечивается системным встроенным ПО (firmware) и такие системы могут стоить дороже.

Модули памяти с ЕСС предназначены для обеспечения большей стабильности, чем обычные модули памяти. Однако, у них есть и некоторые недостатки.

Во-первых, не каждый компьютер может поддерживать память ECC. Большинство серверов и рабочих станций поддерживает ЕСС, но мало какие обычные пользовательские компьютеры её поддерживают. Либо, они вообще с такой память не будут работать, либо функционал ECC не будет задействован.

Во-вторых, вследствие наличие дополнительного чипа ЕСС, и вообще более сложной структуры памяти ЕСС, она стоит дороже, чем обычная, на 10-30%.

В-третьих, ECC RAM немного медленнее, чем не-ЕСС, однако, ненамного, в среднем на 2-5%.

Рис. 2. Модули память ЕСС и не-ЕСС.

Рис. 2. Модули память ЕСС и не-ЕСС.

Итак, наличие ЕСС – основное отличие серверной оперативной памяти от обычной. Чтобы понять, чем они ещё отличаются, рассмотрим подробнее, какие вообще бывают виды оперативной памяти ОЗУ, или RAM (Random Access Memory), и какие виды, где используются.

Буферизованная и небуферизованная память

Есть два основных типа оперативной памяти ОЗУ – буферизованная (buffered) и небуферизованная (unbuffered). В буферизованной памяти есть т.н. уровень повышения мощности обработки (processing power), который ускоряет процессы записи и считывания. В такой памяти модули памяти – 4-битовые, в отличие от 8-16 битовых в небуферизованной памяти.

Основное отличие буферизованной памяти – наличие чипа буфера, который обрабатывает информацию, получаемую от процессора (CPU). Буферный чип затем посылает эту информацию в другие чипы модуля ОЗУ. Такая буферизация позволяет централизовать посылку информации из CPU в чипы ОЗУ. Например, популярный модуль ОЗУ PC3-10600 имеет 18 микросхем памяти, поэтому буферизация для взаимодействия с CPU значительно упрощает работу последнего.

При использовании небуферизованной памяти, CPU будет коммуницировать непосредственно с каждым банком памяти, таким образом, CPU будет посылать информацию на каждый чип на каждом модуле ОЗУ. Хотя при этом система получается немного более расширяемой и гибкой, однако, при этом значительно возрастает потребляемая процессором мощность, и это осложняет выполнение других задач.

В серверах используются, в основном, буферизованные ОЗУ.

Различные типы буферизованной памяти

Регистровая память (Registered Memory, RDIMM, DIMM – Dual In-line Memory Module) – имеет дополнительный чип, который выполняет промежуточные операции между CPU и чипами модулей ОЗУ. Он уменьшает количество сигналов, передаваемых между ОЗУ и CPU. Регистровая память RDIMM, в отличие от небуферизованной UDIMM (Inbuffered DIMM), снижает электрическую нагрузку на компоненты системы, однако, немного снижает производительность. Однако, при этом система может иметь более широкое адресное пространство, чем в небуферизованной памяти. Почти все типы регистровой памяти поддерживают код коррекцию ошибок ECC. Регистровую и небуферизованную память нельзя совмещать в одной системе, даже если она поддерживает оба типа.

Полностью буферизованная память (Fully Buffered Memory, FBDIMM) – это более старая версия регистровой памяти. В DDR3 такая память не используется. Полностью буферизованная память DDR2 и небуферизованная память DDR2 имели различные типоразмеры, чтобы не спутать их при установке.

Память со сниженной нагрузкой (Load Reduced Memory, LRDIMM) – более новая версия буферизованной памяти, где используется чип буфера, ещё более снижающий электрическую нагрузку. При этом снижаются или даже полностью устраняются проблемы с рангами памяти (о чем ниже), что позволяет использовать модули памяти высокой ёмкости без снижения производительности системы (или по крайней мере, снизить этот эффект). Кроме того, LRDIMM даёт возможность не стараться обязательно заполнить все гнёзда на системной плате модулями памяти. Однако, LRDIMM, также как UDIMM и RDIMM, не может сочетаться с другими стандартами в одной системе.

Ранги памяти

Ранг – это число 64-битных областей памяти. Модули памяти могут быть одно-, двух-, четырёх- и восьми-ранговые. Большого влияния на обычные компьютеры это разделение не имеет, однако, для регистровой памяти в серверах они приводят к некоторым ограничениям.

Рис. 3. Виды модулей памяти.

Рис. 3. Виды модулей памяти.

Модули с высшими рангами могут иметь ограничения на то, сколько модулей может быть установлено. Например, если в системе – шесть гнёзд для модулей DIMM, то для 4-ранговых модулей можно занимать только 4 гнезда. Можно ли занимать остальные два гнезда, например, 2- или 1-ранговыми модулями DIMM – зависит от параметров системы. Иногда так делать можно, но следует использовать только определённые гнезда для таких целей. Использование модулей высоких рангов иногда приводит к снижению производительности системы. Таким образом, использование того или иного ранга модулей – часто бывает вопросом компромисса между объёмом ОЗУ и производительностью системы. С одной стороны – чем выше ёмкость ОЗУ, тем выше производительность, с другой стороны, чем выше ранг (и, следовательно, больше объём ОЗУ) тем производительность может быть ниже.

Конструктивные отличия серверной памяти

Серверная память, в особенности, RDIMM и LRDIMM, может отличаться по типоразмерам от памяти для рабочих компьютеров. Кроме того, что модулях серверной памяти бывает напаяно больше компонентов, там могут ещё устанавливаться и теплоотводы, поскольку при работе памяти в сервер выделяется больше тепла, как процессором, так и памятью. Для серверных модулей памяти может также понадобиться больше пространства над ними, для отведения тепловых потоков. Иногда, это обстоятельство вынуждает приобретать специальные низкопрофильные модули VLP (Very Low Profile). Многие пользователи именно такие модули и стараются приобретать, поскольку они в любом случае обеспечивают лучший теплоотвод.

Выводы

Как видим, память серверов имеет некоторые особенности по сравнению с памятью для обычных компьютеров. Прежде всего, это необходимость использования кодов коррекции ошибок ЕСС. Если использовать для сервера обычную память без ЕСС, то либо такая система не заработает, либо её работа будет связана с рисками сбоев, что в корпоративных ИТ-системах недопустимо.

Кроме того, для серверов обычно используется буферизованная память, которая оснащена дополнительным чипом для выполнения промежуточных операции между CPU и чипами модулей DIMM.

Иногда серверная память может иметь и конструктивные особенности, например, размещаться в низкопрофильных DIMM для лучшего теплоотвода внутри корпуса сервера.

Разница между ecc и не оперативной памятью

Оглавление:

  • Что такое ECC и NON-ECC RAM?
  • Различия между RAM ECC и NON-ECC
  • Как определить, используете ли вы модуль, если у вас ОЗУ ECC или NON-ECC

  • Наш вывод о памяти ECC

Возможно, вы не заметили, что память RAM обычно называется по их формату: DDR, DDR2, DDR3 или текущая DDR4. Но среди них есть два типа: оперативная память ECC и NON-ECC. Для домашних пользователей используются ОЗУ и оборудование рабочей станции NON-ECC, а также серверы ECC. Хотите узнать их различия? Мы объясним это вам в этом уроке!

Указатель содержания

Рекомендуем прочитать:

  • Лучшая оперативная память на рынке. Как активировать профиль XMP из BIOS вашей материнской платы. Что такое двухканальный и четырехканальный? Лучший SSD на данный момент.

Что такое ECC и NON-ECC RAM?

Система хранения компьютера иерархизирована подсистемами, которые являются частью целого, это система памяти. Среди этих систем, которые составляют большую, — жесткий диск, оперативная память и внутренний кэш процессора. Конечно, каждый из них имеет определенную цель и функцию, и ОЗУ, которое обозначает оперативное запоминающее устройство (переводится как оперативное запоминающее устройство ), не является исключением из этого правила. Существует множество видов оперативной памяти, и они, как и в случае с ECC и NON-ECC RAM, путают их сходство .

В первую очередь вы должны понимать, какие действия ОЗУ выполняет самостоятельно. Эта оперативная или оперативная память позволяет хранить информацию о записях, которые компьютер использует для выполнения своих задач. Существуют регистры, которые служат специально для определенных действий, то есть каждый тип регистра имеет свою функциональность.

В оперативной памяти хранятся записи определенных задач, поэтому она напрямую влияет на скорость отклика процессора, поскольку существуют блоки хранения данных, позволяющие фрагментировать процессы. Тем не менее, его наиболее отличительной чертой является емкость хранения; Ваша цель всегда будет заключаться в том, чтобы ускорить ответы, чтобы система не остановилась какой-либо программой, и процессор не был вынужден выполнять поиск на жестком диске, поскольку генерация ответа занимает много времени.

Базовый компьютер может неплохо работать с 2 ГБ ОЗУ, в то время как те, кто хочет использовать такие приложения, как игры или профессиональные программы, должны иметь ОЗУ емкостью 16 или 32 ГБ. Конечно, чем выше емкость, тем дороже будет память, а в последние месяцы ее цена относительно завышена из-за спроса на память для смартфонов.

Различия между RAM ECC и NON-ECC

Слово ECC обозначает «Код исправления ошибок», что означает, что в ОЗУ имеется дополнительный бит, представляющий код, запрограммированный для обнаружения ошибок в процессоре и предупреждающий нас о необходимости замены ОЗУ. Поскольку они работают с двоичной системой, если бит достигает 1, значит, он обнаружил ошибку; если это 0, это означает, что все правильно. Когда имеется бит исправления ошибок, это означает, что ОЗУ способно хранить информацию из регистров, которых нет в памяти CACHE процессора; это оперативная память процессора.

Возможно, что ошибки из- за повышения температуры или электронных сбоев иногда происходят, и эти ошибки приводят к изменению некоторых битов регистров и, следовательно, к сбоям процессора. Память ECC RAM имеет архитектуру, которая позволяет обнаруживать измененный бит и исправлять его без потери рабочих данных.

ОЗУ ECC и NON-ECC легко идентифицировать и дифференцировать, поскольку разница в основном составляет один бит. NON-ECC просто не имеет этого бита исправления ошибок, и он известен как обычное ОЗУ, которое присутствует в большинстве компьютеров.

РЕКОМЕНДУЕМ ВАМ Как сжимать оперативную память в Windows 10

Как определить, используете ли вы модуль, если у вас ОЗУ ECC или NON-ECC

Это так же просто, как перейти к вашей наклейке ОЗУ и определить точную модель. Много раз вы получаете надпись «Non-ECC», а иногда модель. Если вы не хотите открывать компьютер, вы можете узнать модель с помощью программы CPU-Z на вкладке SPD.

Обратите внимание на модель и поищите все характеристики на веб-сайте производителя Corsair, G.Skill, Kingston…). В одном из разделов будет ясно, если это не ECC или ECC. Но если вы используете обычный компьютер, мы уже ожидаем, что это будет не-ECC.

Несмотря на такое минимальное различие, они редко используются на одних и тех же устройствах; другими словами, ОЗУ ECC и NON-ECC выполняют те же функции, только ECC имеет дополнительную ценность. Однако, для дополнительного бита, он также имеет тенденцию работать медленнее и может быть на 20-30% дороже и не очень распространен в магазинах. Память ECC обычно используется на центральных серверах из-за необходимости создания резервной системы на случай сбоя обработки. У ноутбука или обычного офисного компьютера не должно возникнуть проблем при работе с обычной памятью, поскольку его использование достаточно просто, чтобы в нем не было сбоев, подразумевающих автоматическое исправление.

Вы нашли статью хорошей? Не забудьте понравиться и поделиться им! Мы с нетерпением ждем ваших комментариев. Спасибо

Модули памяти. Контроль четности и коды коррекции ошибок (ECC).

Ошибки при хранении информации в памяти неизбежны, они обычно классифицируются как отказы и нерегулярные ошибки (сбои). Если нормально функционирующая микросхема вследствие, например, физического повреждения начинает работать неправильно, то все происходящее и называется постоянным отказом. Чтобы устранить этот тип отказа, обычно требуется заменить некоторую часть аппаратных средств памяти, например неисправную микросхему памяти, или устранить обрыв соединения. Нерегулярная ошибка (или сбой) — так называют непостоянный отказ, который не происходит при повторении условий функционирования или через регулярные интервалы (причиной сбоев раньше были как правило альфа-частицы, а их источником служило вещество, используемое в полупроводниках и керамических корпусах микросхем, применявшихся ранее, но изменив технологический процесс, производители памяти избавились от этих примесей). В настоящее время производители памяти почти полностью устранили источники альфа-частиц, и сбои в памяти емкостью 16 Мбайт из-за альфа-частиц случаются в среднем только один раз за 18 лет.

Но по другим причинам сбои памяти происходят значительно чаще и самая главная причина сбоев это космические лучи. Они имеют очень большую проникающую способность, от них практически нельзя защититься с помощью экранирования. В среднестатистическом условном компьютере появление программной ошибки по этой причине в памяти бывает примерно раз в полугодие. Но в серверных системах или мощных рабочих станциях с большим объемом установленной оперативной памяти подобная ошибка в работе памяти возникает почти каждый месяц. Защита от влияния космических лучей возможна (работа в убежище на глубине более 16 метров каменной породы, и программные ошибки в работе памяти вообще не были зафиксированы).

Исследования показали, что доля программных ошибок в 30 раз больше, чем аппаратных. Это неудивительно, учитывая вредное влияние космических лучей. Количество ошибок зависит от числа установленных модулей памяти и их объема. Программные ошибки могут случаться и раз в месяц, и несколько раз в неделю, и даже чаще.

Хотя космические лучи и радиация являются причиной большинства программных ошибок памяти, существуют и другие факторы.

Скачки в энергопотреблении или шум на линии. Причиной может быть неисправный блок питания или настенная розетка.

Использование неверного типа или параметра быстродействия памяти. Тип памяти должен поддерживаться конкретным набором микросхем и обладать определенной этим набором скоростью доступа.

Электромагнитные помехи. Возникают при расположении радиопередатчиков рядом с компьютером, что иногда приводит к генерированию паразитных электрических сигналов в монтажных соединениях и схемах компьютера. Беспроводные сети, мыши и клавиатуры увеличивают риск появления электромагнитных помех.

Статические разряды. Вызывают моментальные скачки в энергоснабжении, что может повлиять на целостность данных.

Ошибки синхронизации. Не поступившие своевременно данные могут стать причиной появления программных ошибок. Зачастую причина заключается в неверных параметрах BIOS, оперативной памяти, быстродействие которой ниже, чем требуется системой, “разогнанных” процессорах и прочих системных компонентах.

Большинство описанных проблем не приводят к прекращению работы микросхем памяти (хотя некачественное энергоснабжение или статическое электричество могут физически повредить микросхемы), однако могут повлиять на хранимые данные.

Игнорирование сбоев, конечно, не лучший способ борьбы с ними. К сожалению, именно этот способ сегодня выбрали многие производители компьютеров. Лучше было бы повысить отказоустойчивость систем. Для этого необходимы механизмы определения и, возможно, исправления ошибок в памяти ПК. В основном для повышения отказоустойчивости в современных компьютерах применяются следующие методы:

— контроль четности;

— коды коррекции ошибок (ECC).

Системы без контроля четности вообще не обеспечивают отказоустойчивости данных. Единственная причина, по которой они используются, — их минимальная базовая стоимость. При этом, в отличие от других технологий (ECC и контроль четности), не требуется дополнительная оперативная память.

Байт данных с контролем четности включает в себя 9, а не 8 бит, поэтому стоимость памяти с контролем четности выше примерно на 12%. Кроме того, контроллеры памяти, не требующие логических мостов для подсчета данных четности или ECC, обладают упрощенной внутренней архитектурой. Портативные системы, для которых вопрос минимального энергопотребления особенно важен, выигрывают от уменьшенного энергопотребления памяти благодаря использованию меньшего количества микросхем DRAM. И наконец, шина данных памяти без контроля четности имеет меньшую разрядность, что выражается в сокращении количества буферов данных.

Статистическая вероятность возникновения ошибок памяти в современных настольных компьютерах составляет примерно одну ошибку в несколько месяцев. При этом количество ошибок зависит от объема и типа используемой памяти. Подобный уровень ошибок может быть приемлемым для обычных компьютеров, не используемых для работы с важными приложениями. В этом случае цена играет основную роль, а дополнительная стоимость модулей памяти с поддержкой контроля четности и кода ECC себя не оправдывает.

Применение не отказоустойчивых к ошибкам компьютеров рискованно и предполагает отсутствие ошибок памяти при эксплуатации систем. При этом также учитывается, что совокупная стоимость потерь, вызванная ошибками в работе памяти, будет меньше, чем затраты на приобретение дополнительных аппаратных устройств для определения таковых ошибок.

Тем не менее ошибки памяти вполне могут стать причиной серьезных проблем, например, представьте себе указание неверного значения суммы в банковском счете. Ошибки в работе оперативной памяти серверных систем зачастую приводят к “зависанию” последних и отключению всех клиентских компьютеров, соединенных с серверами по локальной сети. Отследить причину возникновения проблем в компьютерах, не поддерживающих контроль четности или код ECC, крайне сложно. Последние технологии по крайней мере однозначно укажут на оперативную память как на источник проблемы, тем самым экономя время и усилия системных администраторов и ремонтного персонала.

Контроль четности — это один из стандартов, введенных IBM, в соответствии с которым информация в банках памяти хранится фрагментами по девять битов, причем восемь из них (составляющих один байт) предназначены собственно для данных, а девятый является битом четности. Использование девятого бита позволяет схемам управления памятью на аппаратном уровне контролировать целостность каждого байта данных. Если обнаруживается ошибка, работа компьютера останавливается и на экран выводится сообщение о неисправности. В целях экономии, компании опять начали предлагать компьютеры с памятью без контроля четности и вообще каких-либо средств определения или исправления ошибок (применение модулей памяти без контроля четности сокращало стоимость на 10–15%).

Технология контроля четности не позволяет исправлять системные ошибки, однако дает возможность их обнаружить. Контроль четности оберегает от последствий проведения неверных вычислений на базе некорректных данных, контроль четности точно указывает на источник возникновения ошибок, помогая разобраться с проблемой и улучшая степень эксплутационной надежности компьютера.

Компания Intel и другие производители наборов микросхем системной логики внедрили поддержку контроля четности и кода ECC в большинстве своих продуктов (особенно в наборах микросхем, ориентированных на рынок высокопроизводительных серверов). В то же время наборы микросхем низшей ценовой категории, как правило, не поддерживают эти технологии. Пользователям, требовательным к надежности выполняемых приложений, следует обращать особое внимание на поддержку контроля четности и ECC (а код ECC позволяет не только обнаруживать, но и автоматически корректировать ошибки памяти).

При обнаружении ошибки схема контроля четности на системной плате формирует немаскируемое прерывание (NMI), по которому основная работа прекращается и инициируется специальная процедура, записанная в BIOS. В результате ее выполнения экран очищается и в левом верхнем углу выводится сообщение об ошибке. Текст сообщения зависит от типа компьютера. В большинстве компьютеров в случае ошибки четности процессор не зависает и пользователю предоставляется возможность либо перезагрузить компьютер, либо продолжить работу как будто ничего не случилось.

Коды коррекции ошибок (ECC) позволяют не только обнаружить ошибку, но и исправить ее в одном разряде. Поэтому компьютер, в котором используются подобные коды, в случае ошибки в одном разряде может работать без прерывания, причем данные не будут искажены. Коды коррекции ошибок в большинстве ПК позволяют только обнаруживать, но не исправлять ошибки в двух разрядах. Но приблизительно 98% сбоев памяти вызвано именно ошибкой в одном разряде, т.е. она успешно исправляется с помощью данного типа кодов. В кодах коррекции ошибок этого типа для каждых 32 бит требуется дополнительно семь контрольных разрядов при 4-байтовой, и восемь — при 8-байтовой организации (64-разрядные процессоры Athlon/Pentium). Реализация кода коррекции ошибок при 4-байтовой организации, очевидно, дороже реализации проверки нечетности или четности, но при 8-байтовой организации стоимость реализации кода коррекции ошибок не превышает стоимости реализации проверки четности.

Для использования кодов коррекции ошибок необходим контроллер памяти, вычисляющий контрольные разряды при операции записи в память. При чтении из памяти такой контроллер сравнивает прочитанные и вычисленные значения контрольных разрядов и при необходимости исправляет испорченный бит (или биты). Стоимость дополнительных логических схем для реализации кода коррекции ошибок в контроллере памяти не очень высока, но это может значительно снизить быстродействие памяти при операциях записи. Это происходит потому, что при операциях записи и чтения необходимо ждать, когда завершится вычисление контрольных разрядов. При записи части слова вначале следует прочитать полное слово, затем перезаписать изменяемые байты и только после этого — новые вычисленные контрольные разряды.

В большинстве случаев сбой памяти происходит в одном разряде, и потому такие ошибки успешно исправляются кодом коррекции ошибок. Использование отказоустойчивой памяти обеспечивает высокую надежность компьютера. Память с кодом ECC предназначена для серверов, рабочих станций или приложений, для которых последствия потенциальных ошибок памяти менее желательны, чем дополнительные затраты на приобретение добавочных модулей памяти и вычислительные затраты на коррекцию ошибок. Если данные имеют особое значение и компьютеры применяются для решения важных задач, без памяти ECC не обойтись. По сути, ни один уважающий себя системный инженер не будет использовать сервер, даже самый неприхотливый, без памяти ECC.

Пользователи имеют выбор между системами без контроля четности, с контролем четности и с ECC, т.е. между желательным уровнем отказоустойчивости компьютера и степенью ценности используемых данных.

Оглавление

  • Вступление
  • Коррекция ошибок
  • Финансовая сторона
  • Тестовый стенд
  • Методика тестирования
  • Результаты тестирования
    • Тест памяти
    • 3DMark
    • 7Zip
    • Cinebench
    • CrystalMark
    • Fritz
    • LinX
    • wPrime
    • AIDA64 Extreme
  • Заключение

Вступление

На сегодняшний день на просторах Рунета можно встретить открытые темы на форумах с вопросами – стоит ли брать рабочую станцию с ECC-памятью или можно обойтись обычной? В данных ветках можно прочесть множество противоречивых утверждений, и часть из них говорит о том, что коррекция ошибок сильно замедляет память, а следовательно и ЦП. Но мало кто это проверял на деле на современных процессорах.

Сегодня мы разберемся в этом вопросе и сравним производительность серверного процессора с обоими типами памяти. Но для начала небольшой экскурс.

Коррекция ошибок

Для чего необходима коррекция? И почему в работе памяти возникают ошибки? Перед ответом на эти вопросы следует разделить ошибки на два типа:

  • Аппаратные ошибки;
  • Случайные ошибки.

Причиной появления аппаратных ошибок является дефектная микросхема DRAM, а случайные ошибки возникают под воздействием излучения, альфа-частиц, элементарных частиц и прочего. Соответственно, первые в принципе неисправимы – если чип дефектный, то поможет только его замена; а вот вторые могут быть исправлены.

Почему же так необходима коррекция ошибок в рабочих станциях и серверах? Однобитовая ошибка в 64-битном слове меняет содержимое ячейки памяти, а в конечном итоге на жесткий диск может быть записано другое число, другие данные, при этом компьютер не зафиксирует эту подмену. А изменение бита в оперативной памяти может вызвать сбой программы, что для рабочей станции и сервера недопустимо.

рекомендации

Последние 3070 дешевле 50 тр в Регарде

Компьютеры от 10 тр в Ситилинке

Остатки 4070 Ti за 80 тр в Регарде — успей

16 видов <b>4070 Ti</b> в Ситилинке — от 80 тр

15 видов 4090 в Ситилинке — цены идут вниз

4070 Ti дешевле 80 тр в Регарде

Много 4080 от 100тр — цены в рублях не растут

<b>13900K</b> в Регарде по СТАРОМУ курсу 62

Ищем PHP-программиста для апгрейда конфы

13700K дешевле 40 тр в Регарде

3070 Gainward Phantom за 50 тр

13600K дешевле 30 тр в Регарде

Для обнаружения изменения битов памяти можно использовать метод подсчета контрольной суммы, но он позволяет лишь обнаруживать ошибки без их исправления.

В свое время было предложено много различных способов решения данной проблемы, но на сегодняшний день наибольшее распространение получил метод коррекции ошибок или ECC (Error-Correcting Code). Данный метод позволяет автоматически исправлять однобитовые ошибки в 64-битном слове – SEC (Single Error Correction) и детектировать двухбитовые – DED (Double Error Detection).

Физическая реализация ECC заключается в размещении дополнительной микросхемы памяти на модуле ОЗУ – соответственно, при одностороннем дизайне модуля памяти вместо восьми чипов располагается девять, а при двустороннем вместо шестнадцати – восемнадцать. Таким образом, ширина модуля становится не 64 бита, а 72 бита.

Метод коррекции ошибок работает следующим образом: при записи 64 бит данных в ячейку памяти происходит подсчет контрольной суммы, составляющей 8 бит. Когда процессор обращается к этим данным и производит считывание, проводится повторный подсчет контрольной суммы и сравнение с исходной. Если суммы не совпадают – произошла ошибка. Если она однобитовая, то неправильный бит исправляется автоматически, если двухбитовая – детектируется и сообщается ОС.

Финансовая сторона

Прежде чем приступить к тестированию, необходимо затронуть финансовый вопрос.

Стоимость обычного модуля памяти DDR3-1600 с напряжением 1.35 В и объемом 8 Гбайт составляет около 3600 рублей, а с коррекцией ошибок – 4800 рублей. На первый взгляд ECC-память выходит на 30-35% дороже, что, в целом, не позволяет их сравнивать в силу существенно большей стоимости последней. Но почему же тогда такой вопрос возникает при сборке рабочей станции? Все просто – необходимо смотреть на данный вопрос шире, а именно – смотреть на общую стоимость рабочей станции.

Ценник однопроцессорной станции на базе четырехъядерного восьмипоточного Xeon (настольные процессоры серий i5 и i7 не поддерживают ECC-память) с 32 Гбайтами памяти, материнской платы с чипсетом C222/С224/С226 (десктопные наборы логики Z87/Z97 и другие также не поддерживают память с коррекцией ошибок) будет превышать 70 000 рублей (при условии, что устанавливаются серверные SSD с повышенным ресурсом). А если включить в эту стоимость и дискретную видеокарту, и прочие сопутствующие компоненты, например, ИБП, то ценник из пятизначного превратится в шестиизначный, перевалив планку в 100 000 рублей.

Покупка 32 Гбайт памяти с коррекцией ошибок потребует дополнительных 4-6 тысяч рублей, что по отношению к общей стоимости рабочей станции не превышает 5%, то есть не является критичным. Также переход от десктопного к серверному железу предоставит и другие преимущества, например: интегрированные графические карты P4600 в процессорах Intel Xeon E3-1200 третьего поколения получили оптимизированные драйверы, которые должны повышать производительность в профессиональных приложениях, например, в CAD; поддержка технологии Intel VT-d, которая позволяет пробрасывать устройства в виртуальную среду, например, видеокарты; прочие серверные технологии – Intel AMT или IPMI, WatchDog и другие, которые также могут оказаться полезными.

Таким образом, хоть и сама ECC-память стоит заметно дороже обычной, в общей стоимости рабочей станции данная статья затрат является несущественной, и переплата не превышает 5%.

Тестовый стенд

Для данного обзора использовалась следующая конфигурация:

  • Материнская плата: Supermicro X10SAE (Intel C226, LGA 1150);
  • Процессор: Xeon E3-1245V3 (Turbo Boost – off, EIST – off, HT – on);
  • Оперативная память:
    • 2x Kingston DDR3-1600 ECC 8 Гбайт (KVR16LE11/8 CL11, 1.35 В);
    • 2x Kingston DDR3-1600 8 Гбайт (KVR16LN11/8 CL11, 1.35 В);
  • ОС: Windows 8.1 Pro 64-bit.

Методика тестирования

В рамках тестирования были произведены замеры производительности как при одноканальном режиме работы ИКП, так и при двухканальном. Суммарный объем ОЗУ составил 8 (один модуль) и 16 Гбайт (два модуля) соответственно.

Программное обеспечение:

  • 3DMark 2006 1.2;
  • 7Zip 9.20;
  • AIDA64 Extreme 5.20.3400;
  • Cinebench R15;
  • CrystalMark 2004R3;
  • Fritz 4.20;
  • LinX 0.6.5;
  • wPrime 2.10.

Результаты тестирования

Тест памяти

Перед тем, как приступить к тестированию, проведем замер пропускной способности памяти и латентности.

550x378  31 KB. Big one: 1019x701  26 KB

При изучении результатов можно заключить, что производительность ECC- и non-ECC- памяти находится на одном и том же уровне в рамках погрешности.

550x147  18 KB. Big one: 1017x273  11 KB

Если в предыдущем тесте от замера к замеру выигрывал то один, то другой тип памяти, то при замере латентности ECC-память постоянно показывает большие задержки. Но разница несущественна – всего лишь 1 нс.

Таким образом, замер ПС и латентности памяти не показал особых различий между ECC- и non-ECC-памятью. Посмотрим, повторится ли это в последующих тестах.

3DMark

Тестовый пакет 3DMark содержит подтесты как для процессора, так и для графической карты. Здесь и кроется самое интересное – давно известно, что встроенному видеоядру не хватает существующей ПСП в 25.6 Гбайт/с, поэтому именно в графических подтестах можно выявить негативное влияние коррекции ошибок, если оно вообще есть,…

550x880  50 KB. Big one: 1037x1661  64 KB

… но разницы нет – что ECC, что non-ECC. Ни процессор, ни интегрированное ядро никак не реагируют на замену обычной памяти на DDR с коррекцией ошибок – результаты одинаковы в рамках погрешности. Среднеарифметическая разница составила 0.02% в пользу ECC-памяти для одноканального режима и 1.6% для двухканального режима.

При этом нельзя сказать, что встроенная видеокарта P4600 не зависит от скорости ОЗУ – при одноканальном доступе общий результат почти на 30% ниже, чем при двухканальном. Другими словами, скорость ОЗУ критична для графического ядра, но сами по себе «ECC-версии» не влияют ни на скорость ОЗУ, ни на видеокарту.

7Zip

Архиваторы, как известно, чувствительны к памяти, поэтому, возможно, здесь получится зафиксировать влияние типа памяти на производительность.

550x293  23 KB. Big one: 1027x548  20 KB

Ситуация с архивацией неоднозначная: с одной стороны – в одноканальном режиме (как при распаковке, так и при сжатии) ECC-память уверенно оказывается медленнее на 2%; с другой – в двухканальном режиме при сжатии ECC-память уверенно быстрее, а при распаковке – медленнее, а среднее арифметическое – быстрее на 0.65%.

Скорее всего, причина в следующем – пропускной способности памяти при одноканальном доступе процессору явно недостаточно, и поэтому чуть большая латентность ECC-памяти сказывается на производительности; а при двухканальном доступе ПСП полностью покрывает нужды CPU и поэтому чуть большая латентность памяти с коррекцией ошибок не сказывается на производительности. В любом случае зафиксировать существенного влияния на скорость архивации не получилось.

Cinebench

Тестовый пакет Cinebench содержит подтест как процессора, так и видеокарты.

550x293  20 KB. Big one: 1026x547  20 KB

Но ни первый, ни вторая никак не отреагировали на ECC-память.

Зато налицо явная зависимость видеокарты от ПСП – при одноканальном доступе результат в OpenGL оказался на 25% ниже, чем при двухканальном. Вспоминая результаты 3DMark и смотря на нынешние, можно заключить, что производительность интегрированной видеокарты хоть и зависит от ПСП, но ECC-память не оказывает на нее негативного влияния.

На чтение 9 мин Просмотров 12.5к. Опубликовано 08.09.2021 Обновлено 13.09.2021

Оглавление

  1. Память с коррекцией ошибок
  2. Принцип работы
  3. Однобитовые ошибки
  4. Регистровая память
  5. Чем отличается серверная оперативная память от обычной
  6. Чем еще отличается ОЗУ для сервера
  7. Нужна ли серверная память в обычном компьютере
  8. Почему серверная память не работает на обычных компьютерах
  9. Где необходима ОЗУ c ECC?

В этой статье мы разберемся, что такое серверная оперативная память. Узнаем, чем память для сервера отличается от обычной и что такое поддержка ECC. Поймем, можно ли вставить планку серверной памяти в обычный компьютер и запустить его.

В серверах и рабочих станциях используется не совсем обычная оперативная память.

Основные ее отличия — это поддержка специфических технологий, таких как контроль четности и ECC (коррекция ошибок).

Серверная оперативная память не обладает выдающимися скоростными характеристиками. Для нее намного важнее стабильность и безотказность в работе. Применяется в тех областях, где критически важна бесперебойная работа. Например, финансы и облачные вычисления.

Рассмотрим подробнее технологии, которые применяют в серверной памяти ⇓

  • Error-Correcting Code (ECC) или память с коррекцией ошибок;
  • Регистр между микросхемами модуля и контроллером памяти. Так называемая регистровая оперативка.

Память с коррекцией ошибок

ECC (Error-Correcting Code) позволяет исправлять некоторые ошибки в процессе работы оперативной памяти. В том числе, случайные неточности, то есть те, которые могут возникать под воздействием электромагнитных помех или высокоэнергетических элементарных частиц.

Подобная погрешность появляется из-за изменения значения одного бита в машинном слове. Результат такой ошибки может быть самым непредсказуемым. От изменения одного символа в набранном тексте до зависания всей системы.

Применение технологии ECC необходимо для обнаружения и если это возможно, то исправления подобных проблем. Память, не имеющая поддержки коррекции ошибок, обозначается non-ECC.

Принцип работы

ECC модуль имеет дополнительные микросхемы, по одной на каждые 8 чипов. То есть, при одностороннем дизайне модуля, будет задействовано 9 чипов вместо привычных 8. А при двухстороннем — 18 вместо 16. В дополнительных чипах лежат контрольные суммы машинных слов, хранящихся в памяти.

Обычная DDR3 и серверная DDR3 ECC reg

Если при проверке контрольная сумма машинного слова не совпадает с контрольной сумой, находящейся в чипе-буфере, значит, найдена неточность. При возможности устранить проблему, система продолжает работу, но если коррекция невозможна, то операционной системе отправляется сообщение.

Если ОЗУ использует только технологию ECC, то это не совсем серверная оперативная память. Она рассчитана, в первую очередь, на профессиональные рабочие станции.

Для использования ECC RAM ОЗУ требуется поддержка как со стороны процессора, в котором размещен контроллер памяти, так и со стороны материнской платы. Впрочем, у не самых дешевых CPU и системных плат подобная поддержка нередко есть. Следовательно, память с коррекцией ошибок на них успешно заработает.

Какие преимущества получит обычный домашний или офисный компьютер в этом случае? Теоретически, он будет стабильнее работать. Но стоит учитывать, что применение Error-Correcting Code требует определенных вычислительных мощностей, как следствие, быстродействие снижается, пусть и не намного.

Однобитовые ошибки

Бит представляет собой единую двоичную цифру (1 или 0), причем восемь битов формируют байт — исторически наименьшую единицу адресной памяти, которую компьютеры считают либо как одно число, либо букву. Однобитовая ошибка заключается в том, что электрический заряд бит изменяется, переворачивая его от 0 до 1 или наоборот.

Причины однобитовых ошибок возникают в двух основных вариантах — жестких и мягких ⇓

  • жесткие вызваны такими физическими факторами, как изменение температуры или мощности, а также напряжение на оборудовании;
  • мягкие возникают из-за более сложных факторов, таких как магнитные помехи и даже космические лучи.

В любом случае результат однобитовой ошибки тот же. Неточность, влияющая на одну двоичную цифру, не приведет к концу света, но перевернутый бит может серьезно повлиять на важные данные.

Хотя ошибка может быть безвредной или иметь сравнительно мягкий эффект (например, неправильно окрашенный пиксель в изображении), это может привести к полностью искаженному файлу или сбою всей системы.

В приложениях, обрабатывающих большие объемы чувствительных или высокоценных данных, даже одна однобитовая ошибка может быть катастрофической.

ОЗУ с ECC предотвращает однобитовые ошибки, обнаруживая и исправляя их, гарантируя, что данные будут должным образом сохранены.

Регистровая память

По-настоящему серверной можно считать только регистровую (registered) или буферизованную (buffered) память. Основная ее особенность — это наличие на модуле еще одной микросхемы — регистра.

Регистровая оперативная память DDR4

Регистровая оперативная память DDR4

Регистр выполняет роль буфера между микросхемами памяти на модуле и контроллером ОЗУ. Это необходимо для снятия электрической нагрузки с контроллера, что позволяет установить большое количество модулей.

Наличие регистров уменьшает электрическую нагрузку на контроллер памяти, что позволяет устанавливать большее количество модулей памяти на один канал. Таким образом, обеспечение максимального объема памяти, поддерживаемого современными процессорами, возможно только при использовании регистровой памяти

Вся регистровая оперативка в обязательном порядке поддерживает технологию ECC. Такие модули обычно имеют маркировку ECC reg. Отличие памяти с ECC от регистровой, заключается только в отсутствии микросхемы регистра и компоновке чипов памяти на планке.

Первое поколение ОЗУ DDR PC2700 ECC REG

Первое поколение ОЗУ DDR PC2700 ECC REG

Чем отличается серверная оперативная память от обычной

В первую очередь такая оперативка предназначена для бизнеса и профессиональных задач, где критически важна работа с данными и точностью их обработки и передачи.

По сравнению с обычной, ОЗУ ECC имеет очевидные преимущества. Из-за встроенных возможностей для исправления ошибок, системы с ОЗУ ECC имеют намного меньше отказов, чем с памятью без коррекции ошибок. На практике это означает меньшую потерю данных, меньшее количество сбоев и больше времени безотказной работы.

Однако из-за дополнительной обработки, требуемой для чипов, ECC может оказать небольшое влияние на производительность. Это вряд ли является серьезной проблемой, когда пользователи уделяют первостепенное внимание минимизации ошибок и максимальному времени бесперебойной работы, которые обеспечивает ECC RAM, даже если она действительно имеет незначительный проигрыш в производительности.

Еще одна очевидная разница между памятью с ECC и без нее — это цена. Благодаря своим расширенным функциям память с коррекцией ошибок стоит дороже, чем обычная и поддерживается только на специализированных (дорогостоящих) материнских платах и ​​высокопроизводительных серверных процессорах, таких как Intel Xeon и т.п. В обычную метеринку вставить ее можно, но она там не заработает.

Определить серверная память или нет, можно легко визуально по наличию дополнительных чипов памяти и расположению микросхем на модуле.

ECC RAM нельзя комбинировать с памятью без коррекции ошибок. Поэтому, если вы хотите возможности Error-Correcting Code, вам придется заменить всю оперативку на новые модули.

Чем еще отличается ОЗУ для сервера

  • вполне закономерно, что оперативная память для круглосуточно работающего сервера должна иметь максимальную надежность. Поэтому серверные модули проходят тщательное тестирование, в том числе, и в условиях высокого нагрева;
  • использование серверной регистровой оперативной памяти возможно только если процессор и материнская плата поддерживают ее;
  • серверная оперативная память, также как и обычная, выпускается в разных стандартах: ddr, ddr2, ddr3, ddr4. Физически, серверные модули сохраняют совместимость с десктопными, но работоспособность в обычных материнских платах невозможна;
  • скорость работы буферизованной RAM ниже, чем у стандартного модуля ОЗУ, а вот цена может оказаться заметно выше.

Нужна ли серверная память в обычном компьютере

Конечно неприятно, когда ваш домашний компьютер или ноутбук падает из-за ошибки, но это вряд ли будет иметь серьезные долгосрочные последствия.

Собирать домашний компьютер на серверном железе — достаточно спорное решение. Кроме самих модулей серверной памяти, придется установить серверную системную плату. А для нормальной работы системной платы может потребоваться соответствующий корпус и блок питания, что в итоге приведет к неоправданным расходам и даст только избыточную для большинства домашних систем надежность.

Почему серверная память не работает на обычных компьютерах

Для бизнес-критических серверных приложений короткий ответ — да. На сервере, обрабатывающем конфиденциальную информацию о клиенте или финансовых транзакциях, даже одна ошибка имеет потенциал для катастрофы.

ECC reg RAM настоятельно рекомендуется организациям, которые обрабатывают большие объемы данных клиентов в Интернете, для защиты от финансовых потерь, вызванных поврежденными данными, или репутационного ущерба, вызванного простоями после сбоя системы.

Можно ли играть на серверной оперативной памяти?

Что лучше серверная оперативная память или обычная?

Александр

Александр

В 1998 году — первое знакомство с компьютером. С 2002 года постоянно развиваюсь и изучаю компьютерные технологии и интернет. Сейчас военный пенсионер. Занимаюсь детьми, спортом и этим проектом.

Задать вопрос

Понравилась статья? Поделить с друзьями:
  • Кайен порше электроручника ошибка 000018
  • Как воспринимать ошибки на работе
  • Кайрон ошибка p0266
  • Как включить исправление ошибок на телефоне самсунг
  • Казуальная атрибуция виды и ошибки казуальной атрибуции