Список самых востребованных методов Numpy

NumPy является фундаментом для многих других научных библиотек и предоставляет обширные возможности для работы с многомерными массивами и матрицами. В этом конспекте мы охватим основные команды NumPy, которые являются ключевыми для понимания и эффективного использования библиотеки. Мы начнем с основ - импорта библиотеки и создания массивов, и продвинемся к более сложным операциям, таким как математические расчеты и манипуляции с массивами.

Импорт библиотеки

import numpy as np

Создание и инициализация массивов

Эта группа включает команды для создания новых массивов и их инициализации. Они позволяют генерировать массивы с определенными размерами, значениями и даже случайными числами. Эти команды являются основополагающими для работы с NumPy, так как большинство операций в библиотеке выполняется на массивах.

`np.array`

Создает массив NumPy.

arr = np.array([1, 2, 3, 4]) 
# Создаст массив [1 2 3 4]

`np.zeros`

Создает массив, заполненный нулями.

zeros_arr = np.zeros(3) 
# Создаст массив [0. 0. 0.]

`np.ones`

Создает массив, заполненный единицами.

ones_arr = np.ones(4) 
# Создаст массив [1. 1. 1. 1.]

`np.linspace`

Создает равномерно распределенные значения в заданном интервале.

linspace_arr = np.linspace(0, 1, 5) 
# Создает массив с 5 равномерно распределенными значениями от 0 до 1. 
# [0. 0.25 0.5 0.75 1. ]

`np.arange`

Создает массив с арифметической последовательностью значений.

arange_arr = np.arange(1, 6) 
# Создает массив с арифметической последовательностью от 1 до 5. 
# [1 2 3 4 5]

`np.random.rand`

Генерирует случайные числа из равномерного распределения.

random_values = np.random.rand(3) 
# Генерирует 3 случайных значения от 0 до 1.

`np.random.randn`

Генерирует случайные числа из стандартного нормального распределения.

random_values = np.random.randn(3) 
# Генерирует 3 случайных значения из стандартного нормального распределения.

`np.random.randint`

Генерирует случайные целые числа в заданном интервале.

random_integers = np.random.randint(1, 10, size=5) 
# Генерирует 5 случайных целых чисел от 1 до 9.

Изменение формы и размеров

Команды в этой группе используются для изменения формы существующих массивов, их объединения или разделения. Они позволяют манипулировать размерами и структурой массивов, что является важной частью обработки данных и подготовки их для анализа или визуализации.

`np.reshape`

Изменяет форму массива.

arr = np.array([1, 2, 3, 4, 5, 6]) 
reshaped_arr = arr.reshape(2, 3) 
# Переформирует массив в матрицу 2x3: 
# [[1 2 3] 
# [4 5 6]]

`np.concatenate`

Объединяет массивы.

arr1 = np.array([1, 2, 3]) 
arr2 = np.array([4, 5, 6]) 
concatenated_arr = np.concatenate((arr1, arr2)) 
# Объединяет arr1 и arr2 в один массив: 
# [1 2 3 4 5 6]

`np.transpose`

Транспонирует массив.

arr = np.array([[1, 2], [3, 4]]) 
transposed_arr = np.transpose(arr) 
# Транспонирует массив: 
# [[1 3] 
# [2 4]]

`np.vstack`

Объединяет массивы вертикально (по строкам).

arr1 = np.array([1, 2, 3]) 
arr2 = np.array([4, 5, 6]) 
stacked_arr = np.vstack((arr1, arr2)) 
# Объединяет arr1 и arr2 вертикально: 
# [[1 2 3] 
# [4 5 6]]

`np.hstack`

Объединяет массивы горизонтально (по столбцам).

arr1 = np.array([1, 2, 3]) 
arr2 = np.array([4, 5, 6]) 
stacked_arr = np.hstack((arr1, arr2)) 
# Объединяет arr1 и arr2 горизонтально: 
# [1 2 3 4 5 6]

`np.split`

Разделяет массив на подмассивы.

arr = np.array([1, 2, 3, 4, 5, 6]) 
sub_arrays = np.split(arr, 3) 
# Разделяет arr на 3 подмассива: 
# [1 2] [3 4] [5 6]

Математические операции

В эту группу входят команды для выполнения математических операций на элементах массивов, включая тригонометрические функции, экспоненциальные и логарифмические вычисления. Эти функции широко используются в научных и инженерных расчетах, а также в анализе данных.

`np.dot`

Выполняет матричное умножение.

arr1 = np.array([[1, 2], [3, 4]]) 
arr2 = np.array([2, 3]) 
result = np.dot(arr1, arr2) 
# Выполняет умножение матрицы arr1 на вектор arr2: 
# [8 18]

`np.exp`

Вычисляет экспоненту (e^x) для каждого элемента массива.

arr = np.array([1, 2, 3]) 
exp_values = np.exp(arr) 
# Вычисляет экспоненту для каждого элемента массива: 
# [ 2.71828183 7.3890561 20.08553692]

`np.log`

Вычисляет натуральный логарифм (ln(x)) для каждого элемента массива.

arr = np.array([1, 2, 3]) 
log_values = np.log(arr) 
# Вычисляет натуральный логарифм для каждого элемента массива: 
# [0. 0.69314718 1.09861229]

`np.sin`

Вычисляет синус для каждого элемента массива.

arr = np.array([0, np.pi / 2, np.pi]) 
sin_values = np.sin(arr) 
# Вычисляет синус для каждого элемента массива: 
# [0.0000000e+00 1.0000000e+00 1.2246468e-16]

`np.cos`

Вычисляет косинус для каждого элемента массива.

arr = np.array([0, np.pi / 2, np.pi]) 
cos_values = np.cos(arr) 
# Вычисляет косинус для каждого элемента массива: 
# [1.0000000e+00 6.123234e-17 -1.0000000e+00]

`np.tan`

Вычисляет тангенс для каждого элемента массива.

arr = np.array([0, np.pi / 4, np.pi / 2]) 
tan_values = np.tan(arr) 
# Вычисляет тангенс для каждого элемента массива: 
# [0.0000000e+00 1.0000000e+00 1.63312394e+16]

`np.sqrt`

Вычисляет квадратный корень для каждого элемента массива.

arr = np.array([1, 4, 9]) 
sqrt_values = np.sqrt(arr) 
# Вычисляет квадратный корень для каждого элемента массива: 
# [1. 2. 3.]

Статистические вычисления

Команды этой группы охватывают расчеты статистических показателей, таких как среднее значение, стандартное отклонение, дисперсия, минимальное и максимальное значения. Они необходимы для анализа и интерпретации данных, что делает их ключевыми в области анализа данных и статистики.

`np.mean`

Вычисляет среднее значение элементов массива.

arr = np.array([1, 2, 3, 4, 5]) 
mean_value = np.mean(arr) 
# Вычисляет среднее значение элементов массива: 
# 3.0

`np.sum`

Суммирует элементы массива.

 arr = np.array([1, 2, 3, 4, 5]) 
 sum_value = np.sum(arr) 
 # Суммирует элементы массива: 
 # 15

`np.std`

Вычисляет стандартное отклонение.

arr = np.array([1, 2, 3, 4, 5]) 
std_value = np.std(arr) 
# Вычисляет стандартное отклонение элементов массива: 
# 1.4142135623730951

`np.var`

Вычисляет дисперсию (вариацию) элементов массива.

arr = np.array([1, 2, 3, 4, 5]) 
var_value = np.var(arr) 
# Вычисляет дисперсию элементов массива: 
# 2.5

`np.min`

Находит минимальное значение в массиве.

arr = np.array([1, 2, 3, 4, 5]) 
min_value = np.min(arr) 
# Находит минимальное значение в массиве: 
# 1

`np.max`

Находит максимальное значение в массиве.

arr = np.array([1, 2, 3, 4, 5]) 
max_value = np.max(arr) 
# Находит максимальное значение в массиве: 
# 5

`np.argmin`

Находит индекс минимального значения в массиве.

arr = np.array([5, 2, 8, 1, 7]) 
argmin_value = np.argmin(arr) 
# Находит индекс минимального значения в массиве: 
# 3

`np.argmax`

Находит индекс максимального значения в массиве.

arr = np.array([5, 2, 8, 1, 7]) 
argmax_value = np.argmax(arr) 
# Находит индекс максимального значения в массиве: 
# 2

`np.percentile`

Вычисляет персентили для заданных данных.

data = np.array([1, 2, 3, 4, 5]) 
percentile_25 = np.percentile(data, 25) 
# Вычисляет 25-й процентиль данных. 
# 2.0

`np.histogram`

Вычисляет гистограмму данных.

data = np.array([1, 2, 2, 3, 3, 3, 4, 4, 4, 4]) 
hist, bins = np.histogram(data, bins=[1, 2, 3, 4, 5]) 
# Вычисляет гистограмму данных с указанными интервалами. 
# [1 3 4 2]

Поиск и сортировка

Эта группа включает команды для поиска элементов в массивах, их сортировки, удаления или вставки. Они играют важную роль в организации данных, их эффективном хранении и быстром доступе к ним.

`np.argsort`

Возвращает индексы элементов в отсортированном порядке.

arr = np.array([5, 2, 8, 1, 7]) 
sorted_indices = np.argsort(arr) 
# Возвращает индексы элементов в отсортированном порядке: 
# [3 1 4 0 2]

`np.where`

Возвращает индексы элементов, где заданное условие выполняется.

arr = np.array([1, 2, 3, 4, 5]) 
indices = np.where(arr > 2) 
# Возвращает индексы элементов, где значение больше 2: 
# (array([2, 3, 4]),)

`np.unique`

Возвращает уникальные элементы в массиве.

arr = np.array([1, 2, 2, 3, 4, 4, 4]) 
unique_values = np.unique(arr) 
# Возвращает уникальные элементы в массиве: 
# [1 2 3 4]

`np.clip`

Ограничивает значения в массиве в заданном диапазоне.

arr = np.array([1, 2, 3, 4, 5]) 
clipped_arr = np.clip(arr, 2, 4) 
# Ограничивает значения в массиве от 2 до 4: 
# [2 2 3 4 4]

`np.roll`

Перемещает элементы массива на заданное количество позиций.

arr = np.array([1, 2, 3, 4, 5]) 
rolled_arr = np.roll(arr, 2) 
# Перемещает элементы массива на 2 позиции: 
# [4 5 1 2 3]

`np.searchsorted`

Находит место для вставки элемента в упорядоченном массиве.

sorted_arr = np.array([1, 2, 4, 5, 6]) 
index = np.searchsorted(sorted_arr, 3) 
# Находит индекс для вставки элемента 3 в упорядоченный массив. 
# 2

`np.sort`

Сортирует элементы массива.

arr = np.array([5, 2, 8, 1, 7]) 
sorted_arr = np.sort(arr) 
# Сортирует элементы массива в порядке возрастания. 
# [1 2 5 7 8]

`np.delete`

Удаляет элементы из массива.

arr = np.array([1, 2, 3, 4, 5]) 
new_arr = np.delete(arr, 2) 
# Удаляет элемент с индексом 2 из массива. 
# [1 2 4 5]

`np.insert`

Вставляет элемент в массив.

arr = np.array([1, 2, 3, 4, 5]) 
new_arr = np.insert(arr, 2, 10) 
# Вставляет значение 10 на позицию с индексом 2 в массив. 
# [ 1 2 10 3 4 5]

`np.setdiff1d`

Находит разницу между двумя массивами.

arr1 = np.array([1, 2, 3, 4, 5]) 
arr2 = np.array([3, 4, 5, 6, 7]) 
diff_arr = np.setdiff1d(arr1, arr2) 
# Находит элементы, которые есть в arr1, но отсутствуют в arr2. 
# [1 2]

Линейная алгебра

Команды, относящиеся к линейной алгебре, включают операции над матрицами и векторами, такие как вычисление определителя, обратной матрицы, собственных значений и векторов. Они широко используются в различных областях, от физики до машинного обучения.

`np.fft.fft`

Выполняет быстрое преобразование Фурье (FFT) для заданного сигнала.

signal = np.array([1, 2, 1, -1, 1]) 
fft_result = np.fft.fft(signal) 
# Выполняет FFT для сигнала и возвращает комплексные частоты. 
# [ 4. +0.j 0.5+1.53884177j -2.5+1.93649167j -2.5-1.93649167j 
# 0.5-1.53884177j]

`np.linalg.inv`

Вычисляет обратную матрицу.

matrix = np.array([[2, 1], [1, 3]]) 
inv_matrix = np.linalg.inv(matrix) 
# [[ 1.28571429 -0.42857143] 
# [-0.42857143 0.28571429]]

`np.linalg.det`

Вычисляет определитель матрицы.

matrix = np.array([[2, 1], [1, 3]]) 
det_value = np.linalg.det(matrix) 
# 5.0

`np.linalg.eig`

Вычисляет собственные значения и собственные векторы матрицы.

matrix = np.array([[2, 1], [1, 3]]) 
# Вычисляет собственные значения 
# [1. 4.] 
eigenvalues, eigenvectors = np.linalg.eig(matrix) 
# Вычисляет собственные векторы матрицы. 
#[[-0.70710678 -0.4472136 ] 
# [ 0.70710678 -0.89442719]]

Корреляционные вычисления

Эти команды используются для вычисления статистических связей и зависимостей между различными наборами данных. Они включают функции для вычисления корреляций, ковариаций и аппроксимации данных полиномами.

`np.correlate`

Вычисляет корреляцию между двумя последовательностями.

signal1 = np.array([1, 2, 3, 2, 1]) 
signal2 = np.array([1, 0, -1]) 
correlation_result = np.correlate(signal1, signal2, mode='valid') 
# [2]

`np.cov`

Вычисляет ковариационную матрицу для набора данных.

data = np.array([[1, 2, 3], [2, 3, 4], [3, 4, 5]]) 
cov_matrix = np.cov(data) 
# [[1. 1. 1.] 
# [1. 1. 1.] 
# [1. 1. 1.]]

`np.polyfit`

Вычисляет коэффициенты полинома, соответствующего заданным данным.

x = np.array([1, 2, 3, 4, 5]) 
y = np.array([2, 4, 6, 8, 10]) 
coefficients = np.polyfit(x, y, 1) 
# Вычисляет коэффициенты линейной аппроксимации. 
# [ 2. 0.]

Дополнительно

В эту группу входят дополнительные команды, которые могут быть полезны в специализированных случаях, такие как работа с отсутствующими или некорректными значениями (NaN), интерполяция данных и другие.

`np.interp`

Выполняет интерполяцию для заданных данных.

x = np.array([1, 2, 3, 4, 5]) 
y = np.array([10, 20, 30, 40, 50]) 
interpolated_value = np.interp(2.5, x, y) 
# 25.0

`np.nan`

Обозначает "Not a Number" (NaN), используется для представления отсутствующих или некорректных значений.

Заключение

Мы достигли конца нашего путешествия по основам NumPy. В этом конспекте мы рассмотрели широкий спектр команд, начиная с базового создания массивов и заканчивая более сложными операциями, такими как линейная алгебра и статистические расчеты. NumPy является неотъемлемым инструментом в арсенале каждого специалиста по данным и программиста, работающего с Python.

Список самых востребованных методов Numpy

Создание и инициализация массивов

np.array

np.zeros

np.ones

np.linspace

np.arange

np.random.rand

np.random.randn

np.random.randint

Изменение формы и размеров

np.reshape

np.concatenate

np.transpose

np.vstack

np.hstack

np.split

Математические операции

np.dot

np.exp

np.log

np.sin

np.cos

np.tan

np.sqrt

Статистические вычисления

np.mean

np.sum

np.std

np.var

np.min

np.max

np.argmin

np.argmax

np.percentile

np.histogram