Как рассчитать точность данных

Оглавление:

Anonim

Точность данных является одним из наиболее важных соображений при проведении научного или статистического анализа. Обычно смешанная с не менее важной концепцией точности, аналогия дартс, сформулированная Гавайским университетом, демонстрирует взаимосвязь: точные точки данных усредняются до равных ожидаемых результатов, в то время как точные точки данных группируются близко друг к другу, даже если они не близки к ожидаемые результаты. Согласно Дартмутскому колледжу, точность - это измерение воспроизводимости набора результатов. Точность в наборах данных является важной концепцией даже в усилиях, связанных с технологиями, как показали Кеннет Э. Фут и Дональд Дж. Хьюбнер из Техасского университета в Остине при анализе географических информационных систем. Расчет точности - довольно простое, хотя и несколько субъективное упражнение.

Предметы, которые вам понадобятся

  • Графическое представление набора данных

  • Информация о соответствующих единицах, выраженная в данных

  • Минимально допустимый предел погрешности в эксперименте

Разработайте визуальное представление точек данных, таких как точечная диаграмма. Очень простое визуальное представление включает в себя построение соответствующих зависимых и независимых значений переменных для каждой точки данных в декартовой системе координат.

Оцените группировки точек данных и найдите закономерности. Точные данные проявляются в кластерах точек данных, указывая на то, что похожие входные переменные коррелируют с похожими выходными переменными.

Примените информацию о единицах измерения, используемых для сбора данных, чтобы определить среднее расстояние между точками данных. Простое измерение линейки может использоваться для определения расстояния между точками на графике, а затем преобразовываться с использованием произвольной удобной шкалы, которая соответствует единицам измерения, используемым для генерации точек данных. Это позволит вычислить точность точек данных относительно друг друга, взяв среднее значение расстояний.

Сравните минимальный предел погрешности, допустимый в эксперименте, и среднюю точность точек данных, чтобы определить относительную общую точность эксперимента. Различные типы экспериментов будут иметь большую или меньшую толерантность к ошибкам: инженерный проект, вероятно, потребует точности вплоть до очень маленьких единиц, в то время как социальный эксперимент, скорее всего, допустит большую дисперсию.

подсказки

  • Попытайтесь оценить вероятный масштаб единицы перед созданием графического представления точек данных. Это облегчит визуальную оценку точности, чтобы идентифицировать любые области особенно заметной точности или неточности.

    Четкие шаблоны данных, представленных в визуальном представлении, в высокой степени свидетельствуют о точности и повторяемости эксперимента. Продолжение экспериментов должно добавить дополнительные точки данных в точных кластерах, близких к тем, которые уже существуют.

Предупреждение

Не путайте точность с точностью. Если целью эксперимента является достижение среднего выходного значения отдачи для всех входных данных, и это достигается путем усреднения значений в диапазоне от -12 до 14, это вряд ли будет точным измерением, хотя оно может быть точным. Точное измерение может привести к кластеризации всех точек данных около 17, что будет неточным, но точным и, следовательно, предсказуемым.