PR #1556 Numa - SemanticDiff

Numa #1556

ggerganov merged 20 commits into ggml-org:master from zrm:numa

zrm

zrm

detect NUMA systems and pin work threads to nodes (linux)

6fc5f17e

zrm

disable mmap prefetch/readahead for NUMA systems

0d23f8ce

github-actions

github-actions commented on 2023-05-21

zrm

avoid sending finalize op to thread pool if it does nothing

9d058c20

github-actions

github-actions commented on 2023-05-21

zrm

rankaiyx

ggerganov

ggerganov added performance

ggerganov

ggerganov added threading

zrm

silence robot

2c1b5ae1

zrm

fix args

8502d517

github-actions

github-actions commented on 2023-05-23

ggerganov

zrm

zrm

ggerganov

rankaiyx

rankaiyx

rankaiyx

rankaiyx

rankaiyx

rankaiyx

rankaiyx

rankaiyx

zrm

Piezoid

zrm

rankaiyx

rankaiyx

rankaiyx

ggerganov

rankaiyx

ggerganov

ggerganov requested changes on 2023-06-10

zrm

rankaiyx

ggerganov

rankaiyx

zrm

zrm

make --numa a param

bf83dcb2

zrm

recommendation that n_nodes evenly divide n_threads did not warrant s…

b71dfe63

rankaiyx

rankaiyx

zrm

lower synchronization overhead

adaad10e

zrm

statically allocate

c31d51d4

zrm

move numa state to g_state

2f5bb462

zrm

add description for --numa

4b945821

zrm

rankaiyx

ggerganov

Merge branch 'master' into HEAD

90a0e65c

ggerganov

ggml : minor style changes

d0e35963

ggerganov

ggerganov

ggerganov added high priority

ggerganov

ggml : minor style + try fix sanitizer build

67ba34e8

rankaiyx

rankaiyx

ggerganov

rankaiyx

rankaiyx

rankaiyx

ggerganov

Merge branch 'master' into HEAD

8f98035e

ggerganov

llama : allow to initialize backend with NUMA support

0fe4b00d

ggerganov

llama : avoid ggml include in llama-util.h

875a1e11

ggerganov

ggml : style / formatting

4a555b45

ggerganov

ggerganov force pushed from a38f4a23 to 4a555b45 2 years ago

rankaiyx

ggerganov

ggerganov commented on 2023-06-26

ggerganov

ggml : fix handling of ops with n_threads > n_tasks > 1

81a40e9d

ggerganov

ggerganov approved these changes on 2023-06-26

ggerganov

server : utilize numa parameter

9aec2b74

ggerganov

ggerganov merged b853d456 into master 2 years ago

yiakwy-xpu-ml-framework-team

yiakwy-xpu-ml-framework-team commented on 2023-08-13

yiakwy-xpu-ml-framework-team

Login to write a write a comment.

Login via GitHub

Reviewers

ggerganov

ggerganov

github-actions

github-actions

yiakwy-xpu-ml-framework-team

yiakwy-xpu-ml-framework-team

Assignees

No one assigned

Labels

performance high priority threading

Milestone

No milestone