Hash Map
Последнее обновление
Hash map хранит пары ключ-значение и позволяет искать значение по его ключу в среднем за O(1). Она работает точно так же, как хеш-таблица, но каждая запись корзины несёт и ключ, и связанное с ним значение. Чтобы сохранить или получить пару, ключ хешируется в индекс корзины, затем цепочка этой корзины просматривается в поисках совпадающего ключа. Нажмите воспроизведение выше, чтобы увидеть, как пары размещаются по хешированной корзине и значение извлекается по своему ключу.
Это структура, лежащая в основе dict в Python, HashMap в Java и Map/объектов в JavaScript. Коллизии обрабатываются так же, как в хеш-таблице - здесь методом раздельных цепочек - поэтому производительность зависит от хорошей хеш-функции и низкого коэффициента заполнения.
Временная сложность
| Операция | Средний случай | Худший случай |
|---|---|---|
| Вставка/обновление (put) | O(1) | O(n) |
| Поиск (get) | O(1) | O(n) |
| Удаление | O(1) | O(n) |
| Память | O(n) | O(n) |
Hash map в популярных языках
| Язык | Тип |
|---|---|
| Python | dict |
| Java | HashMap |
| JavaScript | Map / объект |
| C++ | std::unordered_map |
| Go | map |
Разобранный пример
Вставка пар ("cat", 3), ("dog", 5), ("cat", 9), ("emu", 7) в карту с 8 корзинами, используя hash(key) % 8. Предположим, hash("cat") % 8 = 2, hash("dog") % 8 = 5, hash("emu") % 8 = 2:
| Шаг | Структура | Действие |
|---|---|---|
Put ("cat", 3) | корзина 2: [("cat", 3)] | Хешируется в корзину 2; цепочка пуста, поэтому пара добавляется. |
Put ("dog", 5) | корзина 2: [("cat", 3)], корзина 5: [("dog", 5)] | Хешируется в корзину 5; цепочка пуста, поэтому пара добавляется. |
Put ("cat", 9) | корзина 2: [("cat", 9)], корзина 5: [("dog", 5)] | Хешируется в корзину 2; ключ "cat" уже в цепочке, поэтому его значение обновляется до 9. |
Put ("emu", 7) | корзина 2: [("cat", 9), ("emu", 7)], корзина 5: [("dog", 5)] | Хешируется в корзину 2; коллизия с "cat", ключ не найден, поэтому пара добавляется. |
Get "emu" | корзина 2: [("cat", 9), ("emu", 7)] | Хешируется в корзину 2; цепочка просматривается, "cat" пропускается, "emu" совпадает, возвращается 7. |
Когда использовать hash map
| Используйте, когда | Избегайте, когда |
|---|---|
Нужны поиск, вставка и удаление за средние O(1) по точному ключу. | Нужно хранить ключи в отсортированном порядке или делать запросы по диапазону - используйте сбалансированное BST или отсортированную карту. |
| Ключи хешируемы и равенство чётко определено (строки, целые, кортежи). | Ключи изменяемы и могут меняться после вставки, что портит их корзину. |
| Вы считаете, устраняете дубли, кешируете или индексируете по идентификатору. | Нужны гарантии худшего случая O(log n), а не амортизированные средние границы. |
| Порядок обхода не важен или достаточно карты с порядком вставки. | Память очень ограничена - корзины, запас коэффициента заполнения и указатели добавляют накладные расходы. |
Код Hash Map
Чистая, готовая к запуску реализация Hash Map на Python, JavaScript, Java, C++, C. Выберите язык, скопируйте код или откройте его уже загруженным в плейграунде Coddy.
Код Hash Map на Python
1# Python's built-in dict is a hash map: O(1) average2# insert, lookup, and delete.3inventory = {"apple": 3, "banana": 7}4
5# Insert and update6inventory["cherry"] = 57inventory["apple"] += 28
9# Lookup, with .get for a safe default on missing keys10print("apple: ", inventory["apple"])11print("mango: ", inventory.get("mango", 0))12
13# Membership test and delete14print("banana in stock:", "banana" in inventory)15del inventory["banana"]16print("banana in stock:", "banana" in inventory)17
18# Iterate over key-value pairs19for fruit, count in sorted(inventory.items()):20 print(f"{fruit}: {count}")21
22# Classic hash map use case: counting frequencies23words = "the quick brown fox jumps over the lazy dog the end".split()24freq = {}25for word in words:26 freq[word] = freq.get(word, 0) + 127
28print("Occurrences of the:", freq["the"])29print("Most common word: ", max(freq, key=freq.get))Код Hash Map на JavaScript
1// The built-in Map is the idiomatic hash map in JavaScript:2// any key type, insertion-ordered iteration, O(1) average lookups.3const ages = new Map();4
5ages.set("Alice", 30);6ages.set("Bob", 25);7ages.set("Carol", 35);8ages.set("Bob", 26); // set on an existing key updates the value9
10console.log("Bob:", ages.get("Bob"));11console.log("Has Dave?", ages.has("Dave"));12console.log("Size:", ages.size);13
14ages.delete("Carol");15console.log("Size after delete:", ages.size);16
17for (const [name, age] of ages) {18 console.log(`${name} is ${age}`);19}20
21console.log("Keys:", [...ages.keys()].join(", "));Код Hash Map на Java
1import java.util.HashMap;2import java.util.Map;3
4public class Main {5 public static void main(String[] args) {6 Map<String, Integer> ages = new HashMap<>();7 ages.put("Alice", 30);8 ages.put("Bob", 25);9 ages.put("Carol", 35);10
11 System.out.println("Bob -> " + ages.get("Bob"));12 System.out.println("contains Carol: " + ages.containsKey("Carol"));13 System.out.println("Dave or default: " + ages.getOrDefault("Dave", -1));14
15 // getOrDefault makes frequency counting a one-liner16 String[] words = {"apple", "banana", "apple", "cherry", "apple"};17 Map<String, Integer> counts = new HashMap<>();18 for (String w : words) {19 counts.put(w, counts.getOrDefault(w, 0) + 1);20 }21 System.out.println("apple count: " + counts.get("apple"));22
23 ages.remove("Bob");24 System.out.println("size after remove: " + ages.size());25
26 for (Map.Entry<String, Integer> entry : ages.entrySet()) {27 System.out.println(entry.getKey() + " is " + entry.getValue());28 }29 }30}Код Hash Map на C++
1#include <algorithm>2#include <iostream>3#include <string>4#include <unordered_map>5#include <vector>6
7int main() {8 std::unordered_map<std::string, int> ages;9
10 // Insert and update11 ages["alice"] = 30; // operator[] inserts or overwrites12 ages.insert({"bob", 25}); // insert keeps an existing value13 ages.emplace("carol", 41);14 ages["alice"] = 31;15
16 // Lookup17 auto it = ages.find("bob");18 if (it != ages.end()) {19 std::cout << "bob is " << it->second << "\n";20 }21 std::cout << "has dave: " << ages.count("dave") << "\n";22
23 // Remove24 ages.erase("carol");25
26 // Iterate (sort keys first: unordered_map has no defined order)27 std::vector<std::string> keys;28 for (const auto& entry : ages) keys.push_back(entry.first);29 std::sort(keys.begin(), keys.end());30 for (const std::string& name : keys) {31 std::cout << name << " = " << ages[name] << "\n";32 }33 std::cout << "size: " << ages.size() << "\n";34 return 0;35}Код Hash Map на C
1#include <stdbool.h>2#include <stdio.h>3#include <stdlib.h>4#include <string.h>5
6#define BUCKETS 167
8typedef struct Node {9 char key[24];10 int value;11 struct Node* next;12} Node;13
14// A small string -> int hash map with a reusable put/get/remove API15typedef struct {16 Node* buckets[BUCKETS];17 int size;18} HashMap;19
20unsigned int hashKey(const char* key) {21 unsigned int h = 5381;22 for (; *key; key++) h = h * 33 + (unsigned char)*key;23 return h % BUCKETS;24}25
26void mapPut(HashMap* map, const char* key, int value) {27 unsigned int i = hashKey(key);28 for (Node* n = map->buckets[i]; n != NULL; n = n->next) {29 if (strcmp(n->key, key) == 0) {30 n->value = value;31 return;32 }33 }34 Node* n = malloc(sizeof(Node));35 strcpy(n->key, key);36 n->value = value;37 n->next = map->buckets[i];38 map->buckets[i] = n;39 map->size++;40}41
42bool mapGet(const HashMap* map, const char* key, int* out) {43 for (Node* n = map->buckets[hashKey(key)]; n != NULL; n = n->next) {44 if (strcmp(n->key, key) == 0) {45 *out = n->value;46 return true;47 }48 }49 return false;50}51
52void mapRemove(HashMap* map, const char* key) {53 Node** link = &map->buckets[hashKey(key)];54 while (*link != NULL) {55 if (strcmp((*link)->key, key) == 0) {56 Node* old = *link;57 *link = old->next;58 free(old);59 map->size--;60 return;61 }62 link = &(*link)->next;63 }64}65
66int main(void) {67 HashMap map = {0};68 mapPut(&map, "alice", 30);69 mapPut(&map, "bob", 25);70 mapPut(&map, "carol", 41);71 mapPut(&map, "alice", 31); // updates the existing key72 int age;73 if (mapGet(&map, "bob", &age)) printf("bob is %d\n", age);74 printf("has dave: %s\n", mapGet(&map, "dave", &age) ? "yes" : "no");75 mapRemove(&map, "carol");76 printf("size: %d\n", map.size);77 return 0;78}Частые вопросы о hash map
В чём разница между hash map и хеш-таблицей?
Какова временная сложность hash map?
O(1) при хорошей хеш-функции и низком коэффициенте заполнения. В патологическом случае, когда все ключи сталкиваются в одной корзине, они вырождаются до O(n), поэтому важны увеличение размера и хорошее хеширование.Как hash map обрабатывает два ключа, которые хешируются в одну корзину?
Hash map или двоичное дерево поиска: что выбрать?
O(1). Используйте сбалансированное двоичное дерево поиска (например, TreeMap или std::map), когда нужны отсортированные ключи, запросы по диапазону или поиск предшественника/преемника, что стоит O(log n). BST меняет немного скорости на гарантии упорядоченности, которые hash map предоставить не может.Что такое коэффициент заполнения и почему он запускает увеличение размера?
0.75. Увеличение размера - это O(n), но редкое, поэтому оно амортизируется и удерживает средние операции на уровне O(1).Можно ли использовать изменяемый объект вроде списка в качестве ключа hash map?
TypeError: unhashable type для list. Если изменить ключ после вставки, его хеш меняется, и карта больше не может найти его в правильной корзине, молча теряя запись. Используйте неизменяемые ключи, такие как строки, числа или кортежи.